中關村博士後學術交流論壇在京召開
11月25日,由度小滿與中科院自動化研究所、中關村科學城聯合舉辦的“中關村博士後學術交流論壇”在北京召開。中國工程院院士鄔賀銓、度小滿CTO許冬亮、中國科學院自動化研究所研究員、博士生導師宗成慶等行業專家以及來自北京智源人工智能研究院、啓明星辰等中關村高校、企業的博士後參會。
鄔賀銓院士在主題演講“從大模型到智能體”中,詳細闡述了AI Agent與大模型的差異,並預測了AI Agent在智能駕駛、金融、工業、終端等領域的應用前景。
鄔賀銓院士認爲,“大模型的落地應用正在從模型層走向智能體(AI Agent)。智能體與大模型相比,不會只依賴於精心編輯的預訓練數據,解決了大模型難以支撐企業內場景應用的問題,有望成爲強大的通用問題解決方案。如果說大模型是智能手機的操作系統,那麼智能體相當於APP Store。“
他認爲AI在金融領域的應用還處於開始階段,還有待深入開發,在AI獲客、對小微企業經營數據的獲取、貸款人在其它貸款平臺上行爲的瞭解、可質押物的監管狀態等方面還有很多工作要做,AI及智能體還可以在這些方面發揮作用。
度小滿CTO許冬亮介紹了度小滿在金融大模型領域的探索實踐。度小滿近期發佈的開源大模型“軒轅3.0”在各項金融評測任務上表現優異,評分超越了名列前茅的各大中文開閉源模型,在金融事件解讀、金融業務分析、投研應用能力和風險管理等測量維度上超過了GPT4o。
許冬亮表示,“度小滿自從去年發佈‘軒轅’金融大模型以來,已經開源發佈的全參數模型矩陣達19個,可以滿足不同金融領域開發者需求。我們堅持金融大模型的持續開源,希望可以降低金融機構應用大模型的門檻,讓金融可以更有效率地服務實體經濟。”
趙陽副研究員在論壇上介紹了多模態機器翻譯的最新進展和挑戰。趙陽表示,隨着技術的發展,用戶對翻譯系統多模態交互能力要求越來越高。目前市面上接觸到的級聯式方法在實際業務展佔據主流,端到端方法依然有差距,未來探索方向包括開放場景的文本圖象翻譯、基於大模型的圖像翻譯和圖像翻譯的輕量化技術。
談及大模型解讀徵信報告的關鍵挑戰及解決方案,度小滿出站博士後李祥表示,徵信報告解讀涉及風險偏好識別、領域專家知識綜合能力以及超長文本信息挖掘能力三個關鍵能力。在這方面,度小滿的軒轅系列金融大模型展現出了顯著的優勢,有效彌補了開源模型的不足。
面對大模型在金融領域應用面臨金融知識不全面、金融能力待提高等挑戰,度小滿在站博士後霍亮宇認爲,通用大模型進行“金融對齊”升級,能夠使模型在金融領域具備更高的專業能力和安全性。數據顯示,對齊訓練後模型顯著提高模型能力,金融和通用領域相比相比對齊前的模型勝和率超80%。
北京智源人工研究院博士後錢泓錦首先回顧了RAG技術的發展歷程,RAG1.0時代的檢索器和生成器是分開優化的,導致檢索系統依賴於語義匹配的方式,存在效率和準確性的侷限。RAG2.0通過定義檢索器和生成器的聯合優化,使得檢索器在檢索時能夠知道生成器需要什麼,生成器在生成時能夠感知到其他全局信息,從而顯著提升了生成質量。
對於大模型如何提升可靠性、安全性,北京啓明星辰信息安全技術有限公司博士後周瑜認爲,近年來大模型取得了顯著進展,但不同業務階段仍然存在安全風險,現在主流的安全策略爲安全對齊和主動安全防護。展望未來,大模型安全測評的挑戰將來自技術發展的動態性和數據獲取與標註的難題等方面。
最後,中國科學院自動化研究所研究員、博士生導師宗成慶對博士後論壇的學術報告進行了總結,他鼓勵博士後聚焦企業面臨的實際問題探索大模型落地應用的創新方法,使大模型在服務於特定領域的實際任務中充分發揮作用,既體現其性能優勢,又不至於投入太高的成本。同時他強調了技術創新的重要性。他認爲,企業博士後作爲國家高端技術人才,應該勇於站在人工智能技術發展的前沿爲解決企業面臨的技術瓶頸問題提出原創性的解決方案,在學習和跟蹤國際先進技術的同時在大模型理論方法或技術應用方面大膽突破。