ICDAR(International Conference on Document Analysis and Recognition,國(guó)際文檔分析與識(shí)別會(huì)議)是文檔圖像分析領(lǐng)域最重要的國(guó)際會(huì)議之一。今年ICDAR設(shè)立了十余項(xiàng)競(jìng)賽,吸引了來(lái)自谷歌、亞馬遜、百度、阿里、騰訊、北京大學(xué)、清華大學(xué)等諸多國(guó)內(nèi)外頂級(jí)科技公司和知名高校參加。
國(guó)際頂級(jí)賽事,包攬多項(xiàng)佳績(jī)
此次大賽中,視源股份團(tuán)隊(duì)在BDVT-QA的端到端視頻文字識(shí)別任務(wù)中獲得第一名(V-DA)。
在CROHME手寫(xiě)公式識(shí)別賽事的三項(xiàng)任務(wù)——在線(xiàn)公式識(shí)別(On-line recognition)、離線(xiàn)公式識(shí)別(Off-line recognition)、雙模態(tài)公式識(shí)別(Bimodal recognition)均獲得第二名(YP_OCR)。
手寫(xiě)公式識(shí)別結(jié)果
文字識(shí)別與公式識(shí)別的競(jìng)賽任務(wù)與視源股份在教育領(lǐng)域布局的業(yè)務(wù)技術(shù)息息相關(guān),據(jù)悉當(dāng)前這些技術(shù)已廣泛應(yīng)用在seewo學(xué)習(xí)機(jī)的作業(yè)批改、口算計(jì)算等產(chǎn)品中。隨著底層技術(shù)。的成熟和優(yōu)化,視源股份旗下品牌的產(chǎn)品性能和用戶(hù)體驗(yàn)有極大提升贏得良好的口碑。
多領(lǐng)域開(kāi)花,技術(shù)實(shí)力顯現(xiàn)
當(dāng)前大眾對(duì)于視源股份的印象仍然停留在售賣(mài)“顯示器”階段,其實(shí)視源股份一直在積極組建自己的技術(shù)團(tuán)隊(duì),并在多年前成立中央研究院。
中央研究院創(chuàng)立之初旨在為視源股份技術(shù)促增長(zhǎng)戰(zhàn)略提供強(qiáng)力支撐,當(dāng)前中央研究院博士學(xué)歷研究人員占比25%,主要圍繞視覺(jué)計(jì)算、語(yǔ)音信號(hào)信息處理、觸覺(jué)技術(shù)、空間感知、自然語(yǔ)言處理、醫(yī)學(xué)信號(hào)處理、數(shù)據(jù)挖掘等領(lǐng)域進(jìn)行研究,目前團(tuán)隊(duì)已有來(lái)自UCLA、清華、中科院、Apple等海內(nèi)外高層次人才。
今年視源股份中央研究院數(shù)據(jù)挖掘團(tuán)隊(duì)(CVTEDMer)還參與了華為因果推理挑戰(zhàn)賽(PCIC),經(jīng)過(guò)線(xiàn)上篩選和決賽答辯最終取得線(xiàn)上第1名、決賽答辯總成績(jī)第2名的好成績(jī)。
從2018年開(kāi)始,視源股份中央研究院各個(gè)研究團(tuán)隊(duì)開(kāi)始參與各類(lèi)技術(shù)比賽,雄厚實(shí)力斬獲多項(xiàng)殊榮。
以下為視源股份中央研究院團(tuán)隊(duì)部分獲獎(jiǎng)經(jīng)歷:
全國(guó)知識(shí)圖譜與語(yǔ)義計(jì)算大會(huì) 評(píng)測(cè)任務(wù):面向音樂(lè)領(lǐng)域的命令理解任務(wù)(第3名,2018)
阿里天池:“數(shù)智教育”數(shù)據(jù)可視化創(chuàng)新大賽(第1名,2019)
ACM MM Challenge AI Meets Beauty(第3名,2019)
阿里天池:第二屆海南大數(shù)據(jù)創(chuàng)新應(yīng)用大賽-智能算法-簡(jiǎn)歷解析賽(第5名,2020)
2021 年訊飛 AI 開(kāi)發(fā)者大賽-試題標(biāo)簽預(yù)測(cè)挑戰(zhàn)賽(第2名,2021)
CCL 2022漢語(yǔ)學(xué)習(xí)者文本糾錯(cuò)競(jìng)賽(賽道一第3名、賽道四第2名,2022)……
著眼大局,積極布局多模態(tài)感知和交互
視源股份中央研究院的研究方向覆蓋領(lǐng)域廣泛,縱觀技術(shù)的發(fā)展趨勢(shì),結(jié)合團(tuán)隊(duì)的優(yōu)勢(shì)研究領(lǐng)域,當(dāng)前他們正在深耕研發(fā)、積極布局多模態(tài)感知和交互技術(shù)。
隨著互聯(lián)網(wǎng)技術(shù)以及電商潮流的興起,AR技術(shù)在虛擬試衣的應(yīng)用越來(lái)越火爆。針對(duì)當(dāng)前網(wǎng)絡(luò)購(gòu)物無(wú)法體驗(yàn)衣物材質(zhì)的痛點(diǎn)和消費(fèi)者對(duì)未來(lái)網(wǎng)購(gòu)的消費(fèi)期望,視源股份提前布局并深耕紋理反饋技術(shù),并由此延伸,挖掘紋理反饋更多的應(yīng)用場(chǎng)景。
近些年來(lái)手勢(shì)控制依靠自然、高效、便捷的優(yōu)勢(shì)不斷出現(xiàn)在各類(lèi)操作應(yīng)用中,消費(fèi)者們尤其贊賞手勢(shì)隔空操作、不直接接觸物體的安全特性。視源股份依靠研究?jī)?yōu)勢(shì)對(duì)手勢(shì)交互進(jìn)行深度研發(fā),力求應(yīng)用在更多場(chǎng)景、領(lǐng)域、設(shè)備中,刷新人們對(duì)于多模態(tài)的交互體驗(yàn)。
視覺(jué)是人類(lèi)的重要知覺(jué)——定位、識(shí)別物體、了解環(huán)境甚至是辨別面部表情等都是其承載的功能,視源股份中央研究院以“看清世界 看懂世界”為方針,在醫(yī)學(xué)影像、3D場(chǎng)景感知、虛擬人、情感智能等垂直領(lǐng)域進(jìn)行深度探索,致力打造更加多元化的視覺(jué)研究和應(yīng)用。
在白熱化的語(yǔ)音交互賽道,視源結(jié)合業(yè)務(wù)場(chǎng)景對(duì)拾音模塊進(jìn)行深入研究,顯著提升了課堂和會(huì)議場(chǎng)景下的音頻拾音質(zhì)量;通過(guò)對(duì)語(yǔ)音識(shí)別和語(yǔ)義理解方向的研究實(shí)現(xiàn)了技術(shù)方案平臺(tái)化,可為各類(lèi)智能終端設(shè)備提供更便捷且睿智的語(yǔ)音交互。
依托于中央研究院對(duì)于基礎(chǔ)技術(shù)及應(yīng)用技術(shù)的深層次研究和實(shí)踐經(jīng)驗(yàn),視源股份當(dāng)前已在多個(gè)新興領(lǐng)域進(jìn)行戰(zhàn)略孵化。視源股份始終在積極營(yíng)造進(jìn)取、包容和開(kāi)放的科研環(huán)境,緊跟前沿技術(shù)的趨勢(shì),大力推進(jìn)研究成果在未來(lái)教育、企業(yè)服務(wù)、智能硬件、健康醫(yī)療等領(lǐng)域的落地轉(zhuǎn)化,期待充分實(shí)現(xiàn)技術(shù)的產(chǎn)業(yè)價(jià)值和社會(huì)價(jià)值,繼續(xù)通過(guò)科技創(chuàng)新將夢(mèng)想變成現(xiàn)實(shí)。
標(biāo)簽: