谷歌Gemini究竟是怎樣的有多強大?Gemini是一個功能強大的對話式人工智能模型,由谷歌和DeepMind兩個實驗室合力研發(fā),具備多種功能,有望大幅提升軟件開發(fā)人員生成代碼的能力。下面就跟隨小編來了解一下,感興趣的小伙伴快來看看。
谷歌Gemini具體功能詳細介紹一覽
DeepMind負責人Hassabis表示,Gemini是他們最靈活的模型,能夠在各種設備上高效運行,從數(shù)據(jù)中心到移動設備都可以。為了實現(xiàn)這種可擴展性,Gemini 1.0設計了三個不同功能和尺寸的版本。
首先是Gemini Nano,這是端側(cè)設備上最高效的模型。它專為智能手機設計,可以在沒有連接外部服務器的情況下執(zhí)行高效的AI處理任務。目前,Gemini Nano已經(jīng)集成到Pixel 8 Pro中,并支持錄音應用中的“總結(jié)文本”功能以及Gboard的“智能回復”功能。從WhatsApp開始,Gemini Nano明年還將擴展到更多應用。
其次是Gemini Pro,這是在谷歌數(shù)據(jù)中心運行的最佳模型,適用于各種任務。Gemini Pro從今天起為最新版本的AI聊天機器人Bard提供支持。它能夠快速響應并理解復雜的查詢,是Bard推出以來的最大升級。目前,Gemini Pro已經(jīng)為170多個國家和地區(qū)提供英語服務,并計劃在未來幾個月內(nèi)支持新的語言和地區(qū),并應用于搜索、廣告、Chrome和Duet AI等更多谷歌產(chǎn)品。
最后是Gemini Ultra,這是規(guī)模最大且功能最強大的模型,專用于高度復雜的任務。Gemini Ultra計劃在完成當前測試階段后的明年初向開發(fā)者和企業(yè)客戶提供。屆時,還將推出基于Gemini Ultra的Bard Advanced更新版本。
在模型架構(gòu)方面,Gemini仍然采用了Transformer架構(gòu),并采用了高效的注意力機制,支持32k的上下文長度。Gemini的設計使得它能夠在不同設備上靈活部署,并提供高效的AI處理能力。
跑贏多項GPT-4先進性能
谷歌自信地表示,經(jīng)過嚴格的測試和評估,Gemini Ultra在32項學術基準中超越了目前ChatGPT代表的最先進水平。這些基準廣泛應用于大型語言模型的研究和開發(fā),涵蓋了自然圖像、音頻和視頻理解以及數(shù)學推理等領域。在發(fā)布Gemini之前,谷歌對其進行了一系列以標準行業(yè)指標評估的測試。
在大規(guī)模多任務語言理解(MMLU)測試中,Gemini Ultra得分率為90.0%,高于GPT-4的86.4%,成為首個超越人類專家表現(xiàn)的模型。MMLU測試涵蓋了57個科目,包括數(shù)學、物理、歷史、法律、醫(yī)學和倫理等,旨在評估模型在全球知識領域的理解和問題解決能力。
在Reasoning(推理)、Math(數(shù)學)、Code(編碼)三大塊能力測試中,除了HellaSwag(日常任務常識推理)以87.8%落后于GPT-4的95.3%外,其他包括“多步推理挑戰(zhàn)性任務”、“代數(shù)/幾何/預微積分等挑戰(zhàn)性數(shù)學問題”和“Python代碼生成”等多項測試都取得了比GPT-4更高的得分率。
在多模態(tài)能力方面,Gemini Ultra在新的MMMU基準測試中獲得59.4%的SOTA分數(shù),超過了OpenAI多模態(tài)版本GPT-4V的56.8%。這項基準測試跨越了多個不同的領域,需要精密推理多種任務。
在圖像基準測試中,即使沒有采用對象字符識別(OCR)系統(tǒng)輔助,僅通過分析像素信息,Gemini Ultra的表現(xiàn)也超過了以往所有模型。在音頻測試方面,Gemini的自動語音識別和自動語音翻譯分數(shù)均高于接入GPT-4的Whisper系統(tǒng)。
Hassabis表示,這凸顯出了Gemini原生多模態(tài)的優(yōu)越性。迄今為止,創(chuàng)建多模態(tài)模型的通常做法是先獨立訓練不同模態(tài)的單獨組件,再將它們拼接起來,試圖模擬出一些功能。然而,這種方法在概念性更強、更復雜的推理方面往往表現(xiàn)不佳。
相比之下,Gemini從一開始就以原生多模態(tài)的方式設計,在不同模態(tài)上使用由Google設計的TPUs v4和v5e芯片進行預訓練。然后,通過使用更多額外的多模態(tài)數(shù)據(jù)進行不斷微調(diào),以提升效能。這種方法使得Gemini在最初階段就能更自然地理解和推理各種類型的輸入內(nèi)容,并在幾乎所有領域的能力都達到了前所未有的先進水平。
以上就是谷歌Gemini具體功能詳細介紹一覽的全部內(nèi)容了,歡迎關注單詞乎網(wǎng)!我們致力于為您提供最新鮮、最有趣的資訊內(nèi)容。