[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

同步發表至:
ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較 - 巴哈姆特小屋

首先,我們準備了這兩張資訊量很高的圖片

[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

然後一起進行複雜的停車場排位的資訊量測試,要確認該生成式模型是否有理解平面圖與Excel表格之間的關聯性規則:

首先是Google Gemini 1.5 Flash模型
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

再來是ChatGPT-4o模型
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

透過這樣的比較,我們就可以知道,哪一種生成式ai模型最適合挑戰複雜、推理、決策的任務類型了。(如果讀者有看懂,這兩張圖之間的關聯性與龐大資訊量的話。)
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

已經產生幻覺內容的ChatGPT-4o模型 :
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較


仍能準確分析回答的Google Gemini 1.5 Flash模型:


以下是Google Gemini 1.5 Flash排列的停車格
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較


從Excel表格上打開
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

就結果來說,Google Gemini 1.5 Flash輸出Excel表格的成果來說,是可以直接在真實的停車場地上進行無痛使用的(畢竟都有以顏色標記位置區域、數量),反觀ChatGPT-4o模型只是簡單的排出來,要嘛就是將時間重新生成,不然就是將原本只有四個停車格的凌晨班,硬是塞了好幾輛車牌上去,可見GPT-4o不適合處理這種資訊量過於龐大的複雜任務,而且很容易產生幻覺(儘管提示詞內已經有加入具體的凌晨班時段)。


說到要排列停車位,就一定能事前知道每一輛車的抵達時間,所以我們可以使用Google Gemini 1.5 Flash快速計算每一輛車的抵達時間
一流人專做開源未來事,二流人專做停滯不前淘汰事,三流人只做問題進行事,四流人只做同溫取暖裝傻事。
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!