[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

同步發表至：
ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較 - 巴哈姆特小屋

首先，我們準備了這兩張資訊量很高的圖片

[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

然後一起進行複雜的停車場排位的資訊量測試，要確認該生成式模型是否有理解平面圖與Excel表格之間的關聯性規則：

首先是Google Gemini 1.5 Flash模型
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

再來是ChatGPT-4o模型
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

透過這樣的比較，我們就可以知道，哪一種生成式ai模型最適合挑戰複雜、推理、決策的任務類型了。（如果讀者有看懂，這兩張圖之間的關聯性與龐大資訊量的話。）
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

已經產生幻覺內容的ChatGPT-4o模型：
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

仍能準確分析回答的Google Gemini 1.5 Flash模型：

以下是Google Gemini 1.5 Flash排列的停車格
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

從Excel表格上打開
[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

就結果來說，Google Gemini 1.5 Flash輸出Excel表格的成果來說，是可以直接在真實的停車場地上進行無痛使用的（畢竟都有以顏色標記位置區域、數量），反觀ChatGPT-4o模型只是簡單的排出來，要嘛就是將時間重新生成，不然就是將原本只有四個停車格的凌晨班，硬是塞了好幾輛車牌上去，可見GPT-4o不適合處理這種資訊量過於龐大的複雜任務，而且很容易產生幻覺(儘管提示詞內已經有加入具體的凌晨班時段)。

說到要排列停車位，就一定能事前知道每一輛車的抵達時間，所以我們可以使用Google Gemini 1.5 Flash快速計算每一輛車的抵達時間

[實測]ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

小惡魔新聞台

今日熱門文章 網友點擊推薦！

今日熱門文章　網友點擊推薦！