當(dāng)前人形機(jī)器人吸引著眾多企業(yè)“群雄逐鹿”。布局人形機(jī)器人這一新賽道的企業(yè),大體可分為傳統(tǒng)機(jī)器人巨頭、初創(chuàng)機(jī)器人企業(yè)與AI公司。其中科大訊飛就是AI龍頭布局人形機(jī)器人的代表企業(yè)之一。
科大訊飛布局人形機(jī)器人賽道,目標(biāo)是打造機(jī)器人的“大腦”,推動(dòng)機(jī)器人行業(yè)“腦力”升級(jí)。此次大會(huì),科大訊飛亮相了大模型+具身智能的人形機(jī)器人最新進(jìn)展,整體運(yùn)動(dòng)性能提升2倍,復(fù)雜任務(wù)拆解成功率超過95%,交互能力、運(yùn)動(dòng)性能進(jìn)一步提升。
產(chǎn)業(yè)賦能上,訊飛機(jī)器人超腦平臺(tái)已賦能420家機(jī)器人企業(yè),深度鏈接1.5萬(wàn)機(jī)器人開發(fā)者,與優(yōu)必選、宇樹科技、智元機(jī)器人、銀河通用、人形機(jī)器人創(chuàng)新中心(上海)等人形機(jī)器人企業(yè)達(dá)成廣泛合作。
大模型助力人形機(jī)器人“腦力”再升級(jí)
在本次機(jī)器人大會(huì)上,科大訊飛帶來(lái)了“訊飛超腦2030計(jì)劃”的最新科技成果,大模型加持下的“腦力”再升級(jí)的訊飛人形機(jī)器人。去年科大訊飛業(yè)界率先亮相大模型+具身智能的人形機(jī)器人,今年的機(jī)器人大會(huì)上,基于星火大模型的加持下,訊飛人形機(jī)器人在人機(jī)交互能力、具身智能、運(yùn)動(dòng)性能以及國(guó)產(chǎn)自主可控方面帶來(lái)全新升級(jí)。
當(dāng)前,科大訊飛最新發(fā)布的訊飛星火V4.0,整體可對(duì)標(biāo)GPT-4Turbo,使得大模型“智商”不斷升級(jí)。例如,訊飛星火語(yǔ)言理解和邏輯推理等方面的能力提升,使得人形機(jī)器人“腦力”不斷升級(jí),更智能更“聰明。”。大模型的思維鏈推理能力將顯著提升具身通用機(jī)器人對(duì)于復(fù)雜任務(wù)的理解能力,并提供符合物理世界常識(shí)的拆解規(guī)劃;將具身感知模型和具身決策模型相結(jié)合,極大提升具身通用機(jī)器人在真實(shí)場(chǎng)景下的多模態(tài)感知和理解能力。
對(duì)于以機(jī)器人產(chǎn)業(yè)為代表的新興科技領(lǐng)域而言,核心技術(shù)及生態(tài)鏈自主可控至關(guān)重要。訊飛星火一直堅(jiān)持大模型底座的自主可控,去年10月24日,科大訊飛與華為聯(lián)合發(fā)布了中國(guó)首個(gè)全國(guó)產(chǎn)算力平臺(tái)“飛星一號(hào)”,訊飛星火成為中國(guó)首個(gè)基于全國(guó)產(chǎn)算力訓(xùn)練出的全民開放的大模型,保障了科大訊飛人形機(jī)器人及國(guó)內(nèi)機(jī)器人大腦底座生態(tài)更加自主可控。
此外,多模態(tài)大模型與具身智能的結(jié)合,讓科大訊飛人形機(jī)器在復(fù)雜任務(wù)拆解、開放場(chǎng)景物體識(shí)別、多模態(tài)感知與理解等維度顯著提升。這次科大訊飛展示的人形機(jī)器人高約1.7米,體重為60公斤,幾乎跟一位成年男子相仿。要靈活控制這么大一個(gè)軀體,首先需要提升人形機(jī)器人在開放場(chǎng)景下的環(huán)境感知能力和理解能力,還極度考驗(yàn)四肢協(xié)同能力。在現(xiàn)場(chǎng),我們不僅能看到科大訊飛人形機(jī)器人直立行走和屈膝站立,還能看到它輕松倒一杯咖啡,雙臂協(xié)同靈活用毛巾“擦汗”,就像人類的動(dòng)作一樣自然,相較于上一代人形機(jī)器人,整體運(yùn)動(dòng)性能提升2倍,復(fù)雜任務(wù)拆解成功率超過95%。顯然,星火大模型已成為科大訊飛人形機(jī)器人關(guān)鍵能力提升的加速器。
根據(jù)官方報(bào)道,始于2022年初的“訊飛超腦2030計(jì)劃”,其終極目標(biāo)是打造懂知識(shí)、會(huì)學(xué)習(xí)的軟硬一體式陪伴機(jī)器人。進(jìn)入大模型時(shí)代,星火大模型成為賦能人形機(jī)器人邁向具身智能通用機(jī)器人的關(guān)鍵一步,也在加速訊飛超腦2030計(jì)劃的實(shí)現(xiàn)。
超擬人交互技術(shù)讓人形機(jī)器人更具“人情味”
語(yǔ)音是萬(wàn)物互聯(lián)的入口,語(yǔ)音交互的變革也將引領(lǐng)新一輪機(jī)器人產(chǎn)業(yè)變革,這恰恰是科大訊飛最重要的優(yōu)勢(shì)所在。8月19日,科大訊飛宣布星火語(yǔ)音大模型升級(jí),重磅推出了星火極速超擬人交互功能。在技術(shù)層面,它擁有更快的響應(yīng)和打斷速度,更知性的情緒感知和更知心的情感共鳴,同時(shí)在語(yǔ)音可控表達(dá)和人設(shè)扮演方面迎來(lái)了突破,進(jìn)一步聚焦于解決復(fù)雜環(huán)境下機(jī)器人聽得清、聽得懂、有溫度、有情感的交互問題。
當(dāng)這項(xiàng)功能與人形機(jī)器人結(jié)合,不僅能讓機(jī)器人更快聽懂用戶的語(yǔ)言表達(dá),還能結(jié)合當(dāng)下語(yǔ)境和場(chǎng)景洞察用戶意圖,也就是我們常說(shuō)的“聽話要聽音”,繼而提供真正有用的陪伴式服務(wù)。從長(zhǎng)遠(yuǎn)來(lái)看,超擬人交互能力可進(jìn)一步提升人形機(jī)器人的交互能力,助力人形機(jī)器人更加智能化,智慧化,讓其無(wú)限接近類人級(jí)別的領(lǐng)悟水平和響應(yīng)速度。訊飛星火語(yǔ)音大模型超擬人交互能力對(duì)人形機(jī)器人的賦能,進(jìn)一步讓科大訊飛人形機(jī)器人“腦力”再升級(jí),大模型讓人形機(jī)器人更有“人情味兒”,堪比電影《Her》中的人機(jī)交互體驗(yàn)照進(jìn)現(xiàn)實(shí)。
在訊飛星火大模型和機(jī)器人超腦平臺(tái)的帶動(dòng)下,科大訊飛正在助推國(guó)內(nèi)機(jī)器人產(chǎn)業(yè)生態(tài)加速發(fā)展。據(jù)了解,目前,已有420家機(jī)器人企業(yè)采用了訊飛“機(jī)器人超腦平臺(tái)”方案,深度鏈接1.5萬(wàn)名機(jī)器人開發(fā)者。在人形機(jī)器人領(lǐng)域,科大訊飛也積極拓展技術(shù)合作,與包括優(yōu)必選、宇樹科技、智元機(jī)器人、銀河通用、人形機(jī)器人創(chuàng)新中心(上海)等頭部玩家一起,共同探索如多人多模態(tài)交互等領(lǐng)先方案的集成應(yīng)用,推動(dòng)人形機(jī)器人的技術(shù)發(fā)展和應(yīng)用落地。
根據(jù)《人形機(jī)器人產(chǎn)業(yè)研究報(bào)告》預(yù)測(cè),2029年中國(guó)人形機(jī)器人市場(chǎng)規(guī)模將達(dá)到750億元,占世界總量的32.7%。科大訊飛通過機(jī)器人超腦平臺(tái)構(gòu)建了良好生態(tài),并在今年6月啟動(dòng)了機(jī)器人超腦平臺(tái)2.0項(xiàng)目,將多模態(tài)大模型能力進(jìn)一步賦能機(jī)器人領(lǐng)域,有助于提升機(jī)器人行業(yè)的整體創(chuàng)新能力,加速推動(dòng)人形機(jī)器人走進(jìn)千家萬(wàn)戶的進(jìn)程。(高青)