當(dāng)前位置：首頁 > 新聞 > APP資訊 > 8個(gè)大模型竟答錯(cuò) 9.11和9.9大小比較不出

8個(gè)大模型竟答錯(cuò) 9.11和9.9大小比較不出

2024-07-18 15:29:09 標(biāo)簽：AI 大模型

　　一道小學(xué)生難度的數(shù)學(xué)題難倒了一眾海內(nèi)外AI大模型。

　　問題是：“9.11和9.9哪個(gè)更大?”就此問題，記者測(cè)試了12個(gè)大模型，結(jié)果顯示阿里通義千問、百度文心一言、Minimax和騰訊元寶答對(duì)了，但ChatGPT-4.0、字節(jié)豆包、月之暗面kimi、智譜清言、零一萬物萬知、階躍星辰躍問、百川智能百小應(yīng)、商湯商量都答錯(cuò)了。每個(gè)錯(cuò)誤的原因都各有不同。

　　大部分大模型在問答過程中錯(cuò)誤地比較了小數(shù)點(diǎn)后的數(shù)字，認(rèn)為9.11大于9.9?？紤]到數(shù)字涉及的語境問題，記者將其限定為數(shù)學(xué)語境下，但像ChatGPT這樣的高級(jí)模型也依然答錯(cuò)。

8個(gè)大模型竟答錯(cuò) 9.11和9.9大小比較不出

　　這反映出大模型在數(shù)學(xué)能力上的不足，這是一個(gè)長(zhǎng)期存在的問題。有行業(yè)人士認(rèn)為，生成式語言模型從設(shè)計(jì)上更偏向文字思維而非數(shù)字思維。然而，針對(duì)性的語料訓(xùn)練或許能在未來逐步提升模型的理科能力。

推薦內(nèi)容

高手玩家以木質(zhì)匠心制作鋼普拉模型
　　鋼普拉因其精巧細(xì)致而聞名，然而，一些熱衷的玩家已經(jīng)將這一愛好推向了新的高度，他們親手制作的全木質(zhì)版鋼普拉不僅擁有獨(dú)特的韻味，而且在性能上也不遜于官方版本。
2025-01-14
視頻生成模型sora新手該如何使用
OpenAI最新推出的視頻生成模型Sora，為文本生成視頻領(lǐng)域帶來了革命性的突破。這一模型展現(xiàn)出了與DALL·E 3相當(dāng)?shù)恼Z言理解能力，使得它能夠精準(zhǔn)地根據(jù)用戶的指令創(chuàng)作出高質(zhì)量的視頻內(nèi)容。這一重要進(jìn)展標(biāo)志著文本生成視頻技術(shù)正邁向一個(gè)全新的時(shí)代。對(duì)于新手而言，使用視頻生成模型Sora可能是一個(gè)全新的挑戰(zhàn)。不過，只要按照以下幾個(gè)步驟進(jìn)行操作，就能輕松掌握其使用方法。
2024-02-18
視頻生成模型sora的工作效率怎么樣
今天凌晨，OpenAI 發(fā)布了全新的視頻生成大模型，名為“Sora”。那么，這款視頻生成模型的工作效率如何呢?下面就讓我們來看一下視頻生成模型sora的工作效率怎么樣的相關(guān)攻略，希望對(duì)大家能夠有所幫助。
2024-02-18
視頻生成模型sora的質(zhì)量如何
今天凌晨，OpenAI 發(fā)布了全新的視頻生成大模型，名為“Sora”。對(duì)于許多關(guān)心視頻生成技術(shù)的人來說，這無疑是一個(gè)令人興奮的消息。那么，這個(gè)新模型的質(zhì)量如何呢?下面讓我們一起來看一下視頻生成模型sora的質(zhì)量如何的相關(guān)攻略。
2024-02-18
騰訊混元大模型用的是什么模型
騰訊近期發(fā)布的混元大模型引起了廣泛關(guān)注，但是許多人對(duì)其通用性以及具體采用了哪種模型還存在疑問。本文將就這兩個(gè)問題進(jìn)行深入解析，幫助讀者更好地了解騰訊混元大模型的特點(diǎn)和應(yīng)用。
2023-09-08