7月4日,可信大模型公司無限光年(INF)在2024年世界人工智能大會(WAIC)上發布可信光語大模型及其技術報告。可信光語大模型結合大語言模型與符號推理,有效解決幻覺問題,大幅增強模型可信度,賦能金融服務、醫療診斷等垂直領域,讓生成式AI真正成為新質生產力工具。在金融和醫療垂直領域評測中,可信光語大模型超越OpenAI的萬億參數大模型GPT4-Turbo,同時作為“精專”的百億規模大模型,有效提升推理精度,降低服務成本。通過解決模型幻覺問題對企業級應用的重大挑戰,無限光年深入金融、醫療場景,目前已服務多家頭部公司和機構。
在“人工智能:科研范式變革與產業發展”主題論壇上,無限光年聯合創始人徐盈輝博士表示,幻覺問題是大模型被用作生產力工具的核心挑戰之一:如果大模型生成的內容不可控、難以解釋,就很難滿足專業領域對準確性、可靠性、嚴謹性的要求。針對該挑戰,無限光年致力于研發神經符號計算等多種創新技術,并在此基礎上打造新一代可信大模型。
徐盈輝博士介紹,人工智能在多年發展長河中形成了符號學派和聯結學派兩種不同的路徑和理念。神經符號技術將符號學派的推理能力與聯接學派的學習能力有機結合,大幅提升生成式AI在行業應用中的可信生成能力,降低錯誤率、提高可靠性。正如諾貝爾經濟學獎得主丹尼爾·卡尼曼提出的“人類思維有快與慢兩個系統”的理論,符號計算與大模型的結合不僅能用神經網絡實現快速的“黑盒”概率預測,更能進行慢思考的“白盒“邏輯推理。這兩個系統的融合代表著通往未來通用人工智能(AGI)的重要技術方向,也正是無限光年獨特的“灰盒“可信路線。
(無限光年聯合創始人徐盈輝博士在2024年WAIC上發布光語垂直領域大模型)
無限光年積極發展“灰盒”大模型,解決垂直領域的專業問題。在金融領域,特許金融分析師(Chartered Financial Analyst,CFA)考試是全球投資業最嚴格、含金量最高的資格認證,分為三級考試,包含豐富的金融類知識問題和計算推理問題。基于CFA數據集,無限光年金融大模型在一級和二級考試中準確率均超過GPT4-Turbo和Llama3。在一級和二級考試準確率的表現上,無限光年金融大模型得分分別為0.7772和0.5518,GPT4-Turbo分別為0.7177和0. 5259,Llama3分別為0.6723和0.4812。同時,在公開數據集FinanceIQ和Fin-Eval上,無限光年金融大模型的表現也均超過GPT4-Turbo和Llama3。徐盈輝博士同時宣布,無限光年將光語金融大模型API試用,助力大模型在金融行業的發展和應用。
(無限光年光語大模型在垂直領域測試超越OPENAI的萬億參數大模型)
此外,光語大模型在4個公開的權威邏輯推理數據集上準確率都超過GPT-4 Turbo,在ProofWriter、FOLIO、ProntoQA和MedExam Grading中的得分分別為0.99、0.58、0.99和0.80,而GPT4分別為0.91、0.56、0.94和0.64。在醫療領域,無限光年醫療大模型在權威醫療數據集MedBench上,API和自測榜雙榜第一,是首家雙榜超過90分的醫療大模型。API榜綜合得分90.4,在復雜醫學推理,醫學語言理解,醫療安全與倫理三個維度第一。
自成立以來,基于可信大模型技術,無限光年已在大模型產業應用中取得多方面成果。在金融領域,無限光年與頭部證券公司合作推出AI投研助手。借助新一代可信技術,這一投研助手在國內率先實現了用大模型精準、高效、深度解讀企業財報,為分析師等專業人士提供包括信息總結分析、范式寫作和精準搜索在內的一站式功能。到目前為止,該產品已被多家證券公司和資管機構使用。
在醫療領域,無限光年與國內頭部三甲醫院合作,共同基于可信技術創新打造醫療行業大模型,在體檢報告解讀方面有效協助醫生提升報告效率和準確度。
徐盈輝博士認為,在經歷“百模大戰”后,模型的行業應用已成為大模型的發展重心。但在深入專業化場景時,當前通用大模型的表現并不理想。無限光年團隊將持續探索新一代可信的灰盒大模型技術,讓垂直領域大模型更精準、更可信,成為“金融顧問” 、“專業醫生”和更多領域的專家,讓AI技術人人可用、行行受益。
據了解,無限光年團隊既有來自阿里巴巴、螞蟻集團、字節跳動、微軟的國際頂尖AI人才,也有來自摩根大通等金融機構、協和醫院等醫療機構的資深行業專家。基于對行業需求的深入了解,無限光年開發AI原生產品與解決方案,為行業提供多元化的專業服務,推動“灰盒大模型”和生成式AI技術在行業場景的持續落地。此前,無限光年已完成多輪融資,投資人包括阿里云、啟明創投等頭部投資機構。
(公司最新發布技術報告下載鏈接
https://s.infly.cn/f/img/pdf/Towards_Trustworthy_LLMs.pdf?20240703)
大眾商報(大眾商業報告)所刊載信息,來源于網絡,并不代表本站觀點。本文所涉及的信息、數據和分析均來自公開渠道,如有任何不實之處、涉及版權問題,請聯系我們及時處理。大眾商報非新聞媒體,不提供任何互聯網新聞相關服務。本文僅供讀者參考,任何人不得將本文用于非法用途,由此產生的法律后果由使用者自負。
如因文章侵權、圖片版權和其它問題請郵件聯系,我們會及時處理:tousu_ts@sina.com。
舉報郵箱: Jubao@dzmg.cn 投稿郵箱:Tougao@dzmg.cn
未經授權禁止建立鏡像,違者將依去追究法律責任
大眾商報(大眾商業報告)并非新聞媒體,不提供任何新聞采編等相關服務
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP備2023001087號-2