上游觀察·科技|開源還是閉源?下一個轉身的可能是OpenAI

上週,百度宣佈未來幾個月將陸續推出文心大模型4.5系列,並於6月30日起正式開源。

和此前的百度一樣,OpenAI也是閉源大模型陣營的忠實擁躉。2月18日,OpenAI創始人山姆·奧特曼在社交平臺發佈了一條消息:OpenAI的下一個開源項目,到底是做啥更好?這一發問,引來業界諸多猜想。

無論開源或閉源,大模型廣泛應用才能實現價值

開源或是閉源,只是爲大模型在不同場景、不同階段下選擇合適的路線方向,沒有孰對孰錯。

近期,大模型行業出現這一系列變化,DeepSeek爆火是直接原因。半個月前,山姆·奧特曼在柏林工業大學一場圓桌對話中談及DeepSeek。他說,世界上確實需要開源大模型,它們可以爲人們提供大量價值,“我很高興,世界上已經有一些優秀的開源模型。”

在DeepSeek的衝擊下,OpenAI下一代大模型的路線方向有了更新的判斷。其實在6年前,OpenAI彼時推出的GPT-2也是開源大模型社區的一員。但在隨後的6年裡,OpenAI一直堅持閉源策略。

對於大模型開源方向路線轉身速度最快的是百度。此前,百度文心大模型堅守閉源陣營,最新的變化是,百度文心大模型下一代將全面開源。

2月18日晚,在百度2024年第四季度及全年財報電話會上,百度創始人、董事長兼首席執行官李彥宏對於這一變化談及他的思考。李彥宏說,開源的決策源自對於領先地位的堅定信心,開源將進一步促進文心大模型的廣泛應用,並在更多場景擴大其影響力。他還談道,“但我想強調的是,無論開源還是閉源,基礎模型只有在大規模解決現實問題時,才具備真實價值。”

開源將降低開發者門檻,促進更多創新應用出現

普遍觀點認爲,開源將降低開發者的門檻,促進更多創新應用的出現;閉源可能提供更穩定、高性能的服務,適合企業級應用。同時,開源可能帶來不同模型之間的兼容性挑戰,而閉源可能形成更統一的標準。

此外,考慮到數據隱私和合規問題,開源模型可能讓企業更容易定製和審覈,而閉源可能依賴供應商的合規措施。

無論開源或者閉源,將大模型應用於不同領域不同場景,纔是大模型價值的最大呈現。場景優勢,正是大模型在中國市場快速發展的重要因素之一。

北京大學重慶大數據研究院智能創新與賦能中心重慶負責人、重慶市中小企業專家委員會專家李解在接受上游新聞記者採訪時談道,開源大模型最大的價值在於它打破技術門檻,讓中小企業和開發者有機會都能在同一個起跑線上用到高性能大模型。

她說,一方面,開源模型讓大模型的競爭從比拼參數轉向模型能力,模型能力訓練成本降低,同時將加速大模型在產業落地;另一方面,開源模型在不同領域滲透落地,規模化落地將加速反哺推進各領域技術的創新。

結合重慶發展現狀,李解談道,重慶產業基礎雄厚、產業結構完整,應用場景豐富、應用潛力巨大,基礎大模型的滲透具有良好的發展條件。“重慶還有衆多人才研發機構和科創高地,把應用場景和人才優勢聯繫起來,大模型應用創新將帶動新的發展機遇。”

未來大模型也不會全面開源化,閉源模型更適合高價值場景

目前,從全球來看,Meta、Google等開源模型的強大生態已經成形,開發者通過優化代碼、開發工具鍊形成“雪球效應”,正在加速模型的迭代升級。另外,伴隨商業模式的迭代升級,開源基礎模型在支持企業模型調優、推動雲業務增長方面能夠形成協同效應。

市場觀察人士汪健和記者談道,我們可以拿智能手機操作系統做一個類比:比如安卓開源以後全球的手機廠商都在用,蘋果的iOS可以理解爲閉源,只有蘋果自家在用。他說,“雖然開源免費公開了基礎模型,但企業如果需要通過大模型定製服務,那還是得爲大模型企業付費進行深層次打磨。”

汪健認爲,對於普通用戶來說,大模型開源可能有兩方面的好處。第一,任何人自己下載開源模型就可以免費使用,就像之前去打印店打印需要付費,而現在,家裡就有了免費的打印機隨便用;第二,小企業、創業公司無需自己開發模型,通過基礎模型進行調整優化,就能做出自己需要的模型產品。

未來大模型發展會不會“全面開源化”?多位行業人士一致認爲,開源將成爲基礎模型的主流選擇,而閉源模型將聚焦醫療、金融等細分行業的高價值場景。同時,結合商業模式的變化,混合開源模式也將成爲選擇之一,比如開放架構但保留訓練數據,或者以商業盈利爲第一選擇的延遲開源,都可能成爲大模型的演進路徑之一。

上游新聞記者 楊昕華