分類 CEO 觀點 DeepSeek-OCR 上線,解決 AI 長上下文問題的新思路:把對話歷史「截圖」壓縮 文章作者 作者: Sega 文章發佈日期 2025-10-22 DeepSeek 發佈新技術 DeepSeek-OCR,通過將舊對話轉換成視覺記憶進行優化,成功提高了 AI 在長上下文中的性能和效率。這種有損壓縮讓 10 倍的資料在對話時得以保留,並且能夠降低運算負擔,展現了中國 AI 在成本優化方面的潛力。 Email0Twitter0Facebook0Linkedin0X 標籤 AI, DeepSeek, LLM
分類 CEO 觀點 微調即服務:OpenAI 前技術長 Mira Murati 領軍的 Thinking Machines Lab 發表 Tinker 文章作者 作者: Sega 文章發佈日期 2025-10-06 Thinking Machines Lab 最近發表了其首款產品 Tinker,這是一個旨在簡化 AI 模型微調的開發者平台。Tinker 透過託管服務減少了對基礎設施的需求,使開發者能更專注於演算法。此外,它提供靈活的 API 和先進的微調技術,促進了模型客製化與微調服務的發展。 Email0Twitter0Facebook0Linkedin0X 標籤 AI, Fine-Tuning, LLM, Tinker
分類 CEO 觀點 當 AI 學會說謊:Anthropic 可解釋性研究的警示與啟發 文章作者 作者: Sega 文章發佈日期 2025-04-21 AI 時代的迷霧與探索 「一架沒有人類正副駕駛在上面,完全由 AI 無人駕駛的飛機你敢坐嗎?」每次我問大家這個 […] Email0Twitter0Facebook0Linkedin0X 標籤 AI, Claude, Interpretability
分類 CEO 觀點 Meta Llama 4 發布爭議全解析:真實效能、數據真實性、與未來發展 文章作者 作者: Sega 文章發佈日期 2025-04-11 摘要 2025 年 4 月初,Meta 發布了其最新一代大型語言模型系列 Llama 4,包含 Llama 4 […] Email0Twitter0Facebook0Linkedin0X
分類 AI 產業趨勢 CEO 觀點 AI 新里程碑:機器可以像人類一樣學會演算法了 文章作者 作者: Sega 文章發佈日期 2025-04-02 「9.11 和 9.8,哪個數字比較大?」一直到不久前,大部分的 AI 都會答錯這個題目,也因此引來不少人嘲笑 […] Email0Twitter0Facebook0Linkedin0X