新聞資訊
了不起的青年·創(chuàng)投實錄|風(fēng)語智能:瞄準(zhǔn)開源情報新藍海,實現(xiàn)大語言模型的商業(yè)化
發(fā)布時間:
2024-05-13
來源:
2023年ChatGPT的問世被認為是人類科技發(fā)展史上重要的里程碑事件,短短幾個月里席卷全球,速度之快超出想象,也由此帶動包括AI算法、大模型和大數(shù)據(jù)等的迅猛發(fā)展。
作為有著突出處理大規(guī)模數(shù)據(jù)集能力的自然語言處理(NLP)大模型(簡稱“大語言模型”),便隨著ChatGPT的橫空出世走向全新的高度,市場呈現(xiàn)出產(chǎn)品和應(yīng)用百花齊放的盛況,并通過與各行各業(yè)的應(yīng)用結(jié)合,探索能夠有效落地的商業(yè)模式。其中開源情報便是因大語言模型的引入迎來重大變革和進步、并與人工智能融合形成商業(yè)閉環(huán)的行業(yè)。這一行業(yè)模式的探索者者是來自南京大學(xué)電子科學(xué)與工程學(xué)院的博士生,南京風(fēng)語智能信息技術(shù)有限公司(以下簡稱“風(fēng)語智能”)創(chuàng)始人路思遠。
緣起科研項目,思考商業(yè)前景
風(fēng)語智能是一家專注于運用先進人工智能技術(shù)開展開源情報分析的公司,創(chuàng)辦于2023年9月,目前已獲得南京市創(chuàng)新投資集團、奇跡創(chuàng)壇的兩輪投資。
“大三時開始我就跟隨芯片設(shè)計和人工智能領(lǐng)域里的國際頂尖專家王中風(fēng)教授從事新一代人工智能技術(shù),特別是深度學(xué)習(xí)加速器設(shè)計的研究。考上研究生之后,我也正式加入了王教授領(lǐng)銜的集成電路與智能系統(tǒng)(ICAIS)實驗室,主攻語音識別和自然語言處理技術(shù)(NLP),有幸成為國內(nèi)最早關(guān)注大模型技術(shù)研究者中的一員。”路思遠在介紹自己求學(xué)歷程時展現(xiàn)出對于行業(yè)的激動與熱情,當(dāng)2017年Google顛覆性地提出基于自注意力機制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)——Transformer架構(gòu)時,路思遠在和實驗室老師同學(xué)們的交流中,就認識到這一架構(gòu)在深度學(xué)習(xí)領(lǐng)域具備顛覆性的潛質(zhì)。相比傳統(tǒng)深度神經(jīng)網(wǎng)絡(luò),Transformer更加高效與簡潔,如果與醫(yī)療、金融、情報等行業(yè)結(jié)合,又可以進一步推動相關(guān)技術(shù)的發(fā)展,大大提升信息處理和決策效率。
隨著對技術(shù)的不斷挖掘與研究,路思遠開始對高效支持Transformer模型計算的硬件架構(gòu) “發(fā)起挑戰(zhàn)”,不斷地通過研發(fā)平衡計算效率、存儲訪問、能效比和靈活性等多方面需求,以適應(yīng)不斷發(fā)展的AI模型和技術(shù)趨勢。讀博期間,他發(fā)表了第一篇Transformer硬件架構(gòu)工作論文,并獲得2020年IEEE片上系統(tǒng)年會的最佳論文獎,也由此成為了國際上最早設(shè)計出Transformer硬件架構(gòu)人員之一。
2022年11月,當(dāng)搭載了GPT3.5的ChatGPT橫空出世,憑借逼真的自然語言交互與多場景內(nèi)容生成能力一鳴驚人時,也讓路思遠對大模型和商業(yè)相結(jié)合的前景有了更多期待。他坦言:“我一直有創(chuàng)業(yè)的夢想和念頭,也希望能夠抓住大模型技術(shù)迅速發(fā)展的風(fēng)口,讓自己的研究能夠產(chǎn)生商業(yè)價值。”在王中風(fēng)教授的支持下,他與深度學(xué)習(xí)數(shù)據(jù)壓縮方向的施禹伯博士組成團隊,從系統(tǒng)、算法、硬件三個維度入手,解決最新深度之習(xí)NLP算法部署難、落地難的問題,并希望可以實現(xiàn)RiSE架構(gòu)和NPU部署工具鏈的自主設(shè)計,在研發(fā)過程中找到競爭優(yōu)勢和商業(yè)轉(zhuǎn)化機遇。
寧聚計劃留人才,校地融合促發(fā)展
2023年3月,在導(dǎo)師王中風(fēng)教授和南京大學(xué)國際創(chuàng)新創(chuàng)業(yè)學(xué)院的支持下,風(fēng)語智能在南京大學(xué)大學(xué)生創(chuàng)業(yè)園正式成立。
“‘風(fēng)’象征著流動和快速傳播,‘語’則與語言、交流相聯(lián),以‘風(fēng)語智能’命名公司,是希望公司的產(chǎn)品可以像風(fēng)一樣高效且自然流暢地傳遞和處理信息。所以我們集中精力去做研發(fā),但是很快也發(fā)現(xiàn)初創(chuàng)公司資金、資源、人才是不得不面對的現(xiàn)實問題。”雖然是連續(xù)創(chuàng)業(yè)者,但是當(dāng)真正作為創(chuàng)始人肩負公司的發(fā)展責(zé)任后,路思遠不得不思考和鉆研得更多一些。隨著寧聚計劃的深入貫徹落實,更多青年創(chuàng)客選擇留寧展業(yè)。為了獲得更多的支持與關(guān)注,路思遠決定攜手團隊參加了由市人社局主辦、南京市創(chuàng)新投資集團支持的2023年“贏在南京”青年大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽。經(jīng)過激烈的廝殺拼搏,路思遠的“風(fēng)語智能”從3500多個創(chuàng)業(yè)項目脫穎而出,獲得評委一致認可,斬獲了這屆大賽的一等獎桂冠,憑此得到了南京市創(chuàng)新投資集團天使基金的專項資金支持與財政獎勵,“南京大學(xué)在創(chuàng)業(yè)場地上、創(chuàng)業(yè)教育上給了我們很多支持,同事創(chuàng)投集團的天使投資與財政補助在資金上給與我們助力,創(chuàng)投集團專業(yè)的投后孵化服務(wù),也讓我們在思考產(chǎn)品與市場間關(guān)系上有了更多的專業(yè)助力,讓我們的創(chuàng)業(yè)之路走的更穩(wěn)更安心。”同年,路思遠向知名AI天使投資機構(gòu)奇績創(chuàng)壇提交了圍繞語言大模型應(yīng)用的創(chuàng)業(yè)項目申請,得到創(chuàng)始人陸奇博士青睞,成為2023年春季創(chuàng)業(yè)營60個入選項目之一,自此邁開市場化融資的第一步。
瞄準(zhǔn)開源情報,聚焦打造高性能產(chǎn)品
2023年4月,貝哲斯咨詢對外發(fā)布了《2023-2029年中國開源情報行業(yè)市場發(fā)展趨勢調(diào)研報告》,報告內(nèi)容覆蓋行業(yè)概況、上下游情況、行業(yè)頭部企業(yè),主要競爭力產(chǎn)品等,體現(xiàn)出開源情報對政企單位策略部署、戰(zhàn)略制定、趨勢判斷、風(fēng)險預(yù)知等的重要意義。
路思遠和團隊敏銳地捕捉到開源情報行業(yè)的發(fā)展前景以及在大量商業(yè)情報檢測、搜集和分析過程中,對數(shù)據(jù)高效精準(zhǔn)獲得、抓取、交互和大量文本快速總結(jié)的需求。“目前開源情報業(yè)持續(xù)以6.23%的CAGR增長,預(yù)計2028年市場規(guī)??赏_到395.89億元,對于人工智能應(yīng)用落地而言,這是一片具有極大發(fā)展空間且與大語言模型優(yōu)勢高度匹配的藍海市場。所以我們在產(chǎn)品研發(fā)和市場開拓上做了大膽地嘗試。”
深度思考,謀定而動,風(fēng)語智能聚焦開源情報業(yè),立足Transformer神經(jīng)網(wǎng)絡(luò)高性能計算、深耕深度學(xué)習(xí)數(shù)據(jù)壓縮等領(lǐng)域,將AI大模型在文字工作方面的優(yōu)勢充分發(fā)揮,結(jié)合大規(guī)模預(yù)訓(xùn)練模型壓縮算法和高性能計算方案上的優(yōu)勢,打磨產(chǎn)品力,最終研發(fā)出在垂直領(lǐng)域集推理速度快、回答準(zhǔn)確率高、響應(yīng)速度快、吞吐率強、外掛數(shù)據(jù)庫容量大、數(shù)據(jù)可交互治理、能私有化部署等多重優(yōu)勢的“高性能智庫Agent”產(chǎn)品。大模型時代,訓(xùn)練數(shù)據(jù)獲取和復(fù)用成本的降低,效率卻顯著提升。
“智庫Agent相較于傳統(tǒng)產(chǎn)品來說,性能更高、響應(yīng)更快、保密性好,擁有針對多模態(tài)數(shù)據(jù)(視頻圖片、文字)的RAG算法且對上傳文件的數(shù)量沒有限制,能夠能快速分析上傳的文件內(nèi)容,實現(xiàn)各類數(shù)據(jù)統(tǒng)一治理加個性化推送。優(yōu)點足夠突出,用戶體驗感才能好。”路思遠介紹道。“但是大模型技術(shù)成本高,且最新深度學(xué)習(xí)NLP算法更是部署難、落地難。我們在NLP的算法、硬件、云端、嵌入式端部署等方面積累關(guān)鍵技術(shù)使得產(chǎn)品在軟件與硬件方面有突出優(yōu)勢,從而大大降低成本。”高性能智庫Agent產(chǎn)品屬性能很好地應(yīng)用于開源情報領(lǐng)域,風(fēng)語智能通過人工智能與開源情報的結(jié)合,在大模型產(chǎn)品落地方面上探索出一條新路徑,推動了該領(lǐng)域邁向智能化、自動化時代。
目前風(fēng)語智能團隊已與5家客戶簽訂項目合作協(xié)議、與十余家進入探討合作,包括江蘇頭部政府智庫、博智安全、南京云創(chuàng)大數(shù)據(jù)等。其中為某醫(yī)院建立精神疾病問診的大模型知識庫已得到有效推進,通過提升醫(yī)院的數(shù)據(jù)分析能力與水平,實現(xiàn)病案智能生成,輔助醫(yī)生診治,達到醫(yī)院問診速度與準(zhǔn)確性提升的目的。
團隊緊密合作,開創(chuàng)產(chǎn)品新未來
“創(chuàng)業(yè)征途,團隊為舵,齊心協(xié)力,行必致遠。”路思遠博士作為發(fā)起人,聯(lián)合深度學(xué)習(xí)數(shù)據(jù)壓縮方向的施禹伯博士組成團隊,邀請導(dǎo)師王中風(fēng)教授和南大信息管理學(xué)院裴雷院長等學(xué)界與業(yè)界大咖擔(dān)任首席科學(xué)家和技術(shù)顧問,背靠南京大學(xué)ICAIS實驗室,在雄厚的技術(shù)研發(fā)背景和實力下,團隊緊密配合,分工明確,借鑒大模型技術(shù)迅速研發(fā)新產(chǎn)品。
“接下來,我們希望為客戶提供實際應(yīng)用中所需的軟硬結(jié)合解決方案,實現(xiàn)產(chǎn)品軟硬一體”。談到規(guī)劃,路思遠表示將持續(xù)研發(fā)和迭代高性能的硬件設(shè)備,為風(fēng)語智能產(chǎn)品的安全性能提供重要的保障,以確保產(chǎn)品接入網(wǎng)絡(luò)獲取外部信息時用戶內(nèi)部數(shù)據(jù)不外泄。與此同時,讓公司的產(chǎn)品服務(wù)在軟硬件一體的加持下,壁壘更高、競爭力更強。
如今,風(fēng)語智能已研發(fā)出了針對情報行業(yè)細分需求的軟硬件一體化產(chǎn)品,申請了多項知識產(chǎn)權(quán),并與多家公司達成項目合作,榮獲多個優(yōu)秀項目獎項……取得傲人成績的背后是風(fēng)語智能團隊的創(chuàng)業(yè)投入和激情,以及對商業(yè)市場的敏銳度和拓展能力。
南京市創(chuàng)新投資集團大創(chuàng)投資團隊表示,“贏在南京”青年大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽我們關(guān)注到了風(fēng)語智能。風(fēng)語智能作為開源情報業(yè)與人工智能領(lǐng)域的創(chuàng)新公司,作為來自南京大學(xué)的年輕創(chuàng)業(yè)團隊,擁有扎實的技術(shù)背景,助力產(chǎn)品落地開源情報領(lǐng)域。作為國有創(chuàng)投機構(gòu),我們將持續(xù)關(guān)注早期科技企業(yè)的發(fā)展,并圍繞資本、管理、資源、人才等給予團隊更多投后助力。未來,我們將不斷加強與在寧高??蒲性核暮献髀?lián)動,切實落實南京市校地融合發(fā)展要求,支持更多如風(fēng)語智能一樣的青年創(chuàng)業(yè)企業(yè),大力促進更多高校青年科研成果轉(zhuǎn)化落地。”
“經(jīng)過探索,我們已經(jīng)瞄準(zhǔn)賽道,逐步實現(xiàn)產(chǎn)品研發(fā)到落地的商業(yè)閉環(huán),”路思遠介紹說。“選擇開源情報行業(yè)深挖大語言模型的應(yīng)用也是幾番思索的結(jié)果。大國博弈,情報是重要決策的基礎(chǔ),科技實力是最直接的競爭。缺乏高質(zhì)量、及時準(zhǔn)確的情報或許將讓企業(yè)乃至國家面臨極其被動的局面。所以,我們也想在自己擅長的領(lǐng)域,為中華民族偉大復(fù)興貢獻一份力量,至少在開源情報這條賽道上,助力國家建立自己的核心競爭力!”路思遠在談及對于深耕開源情報業(yè)的愿景時,目光堅定。
來源:創(chuàng)投集團
審核:薛瑤
發(fā)布:尤異
相關(guān)附件