台北時間2025年1月28日凌晨,DeepSeek團隊發佈兩款多模態框架——Janus-Pro 和 JanusFlow。
這一次,我們想重點聊聊Janus-Pro。
Janus-Pro是一款統一多模態理解與生成的創新框架,是 Janus 的升級版本,它通過解耦視覺編碼的方式,極大提升了模型在不同任務中的適配性與性能。
它在圖像生成基準測試中表現卓越,超越了 OpenAI 的 “文生圖” 模型 DALL-E 3。此外,和之前的Janus系列一致,它同樣選擇開源。
其一共包含兩個參數模型,分別是 15 億參數的 JanusPro 1.5B 和 70 億參數的 JanusPro 7B。
https://hao.cnyes.com/post/133161
我比較想知道,AI應用能帶來甚麼市場顛覆 ? DeepSeek可以稱霸工廠組裝機器人、汽車無人自動駕駛、無人機,自動生成軟體系統、網站、甚至各種預測、規劃、控制、反應應用嗎 ?
如果只是把DeepSeek當成DeepFake、DataMinding來用,那,應該是只有網軍會高興,一般人不會這樣玩,我注重的是市場影響力而不是成本。
講白一點,我對其成本和前景有疑慮,因為,以大陸對AI的運用,我目前了解的是,幾乎都是基於政府監控而免費的大數據取得成本,7/24不間斷的自我學習,剩下才是人工設計調整的部分,所以,目前達到的水準,如果無法更進一步,那以後將步目前IC製程的後塵,大陸可以稱霸45-28nm,但7nm以下甚至2nm,還是要看外國臉色。
說能以更低成本發展AI,其實我是有疑慮的,因為,設備是硬成本,但更貴的是軟成本:大陸的國家支持+大數據取得低成本+薪資、勞動條件+無視法規、專利,這些可不是外國能學得來的,很好奇,目前哪個國外企業,可以這麼搞的 ?
我比較期望看到一些數據:登記用戶數、商用用戶數、哪些企業導入、哪些市場應用,如果有國外整廠輸出、汽車自駕有導入的話,那就能更適切地看到,DeepSeek是敲響了甚麼警鐘?
最後嘴一句:大陸好歹有過假CPU的前科,所以,我對其成本、設備的說法,其實在未經驗證之前,是有很大的疑慮,看看就好,但,別當真!