登入

會員權益

獲取需求

查看名片

專屬客服

尊貴標識

VIP低至1.5U/天

OpenAI公佈最新具思考能力的旗艦模型o3

分享

支付動態

2024-12-23

OpenAI計畫2025年初陸續部署新一代旗艦模型家族o3,先由專門為程式撰寫優化速度的o3 mini打頭陣

OpenAI說明,o3技術提升的關鍵之一是deliberative alignment(審慎遵循)。這是一種以人為撰寫的文字及可解讀的安全規格教導o系列LLM,並訓練他們在回答用戶查詢前先清楚理解這些規格。研究人員的新訓練方法讓o系列模型使用思維鏈(chain-of-thought,CoT)推理方法來思考用戶提示、從OpenAI內部政策辨識出相關文字,再草擬出更安全的回應。這新訓練方法讓模型得以準確遵循OpenAI的安全政策而無需人類標籤過的CoT或答案。

OpenAI說前一代的o1在此類訓練下,在多項內、外部安全標竿測試中已經大幅超越GPT-4o和其他尖端LLM,且在多種資料集也展現高效能。OpenAI相信這種新方法,可同時用於提升LLM能力以及AI安全性。

為了迎戰新的OpenAI o3模型,Google已在本週稍早公佈Gemini 2.0 Flash Thinking實驗模型,供開發人員測試。新模型將能混合圖文、產生多種情感的聲音,還能使用搜尋及程式,可更完美控制代理人。

免責聲明:
詳情

Please Play Responsibly:

Casino Games Disclosure: Select casinos are licensed by the Malta Gaming Authority. 18+