分類
CEO 觀點

DeepSeek-OCR 上線,解決 AI 長上下文問題的新思路:把對話歷史「截圖」壓縮

DeepSeek 發佈新技術 DeepSeek-OCR,通過將舊對話轉換成視覺記憶進行優化,成功提高了 AI 在長上下文中的性能和效率。這種有損壓縮讓 10 倍的資料在對話時得以保留,並且能夠降低運算負擔,展現了中國 AI 在成本優化方面的潛力。

分類
CEO 觀點

微調即服務:OpenAI 前技術長 Mira Murati 領軍的 Thinking Machines Lab 發表 Tinker

Thinking Machines Lab 最近發表了其首款產品 Tinker,這是一個旨在簡化 AI 模型微調的開發者平台。Tinker 透過託管服務減少了對基礎設施的需求,使開發者能更專注於演算法。此外,它提供靈活的 API 和先進的微調技術,促進了模型客製化與微調服務的發展。

分類
CEO 觀點

當 AI 學會說謊:Anthropic 可解釋性研究的警示與啟發

AI 時代的迷霧與探索 「一架沒有人類正副駕駛在上面,完全由 AI 無人駕駛的飛機你敢坐嗎?」每次我問大家這個 […]

分類
CEO 觀點

Meta Llama 4 發布爭議全解析:真實效能、數據真實性、與未來發展

摘要 2025 年 4 月初,Meta 發布了其最新一代大型語言模型系列 Llama 4,包含 Llama 4 […]

分類
AI 產業趨勢 CEO 觀點

AI 新里程碑:機器可以像人類一樣學會演算法了

「9.11 和 9.8,哪個數字比較大?」一直到不久前,大部分的 AI 都會答錯這個題目,也因此引來不少人嘲笑 […]