
ॐ蓁有福報の小資女ॐ
解答大師
·
06月10日 15:38 (已編輯)
Lv.13
《AI生成時代,科技巨擘脫穎而出!》 目前,美國民眾對AI的態度仍是分歧的。 根據賓特利大學(Bentley University)與蓋洛普(Gallup)2024年進行的一項全國性調查,約56%受訪者認為AI發展「好壞參半」,另有31%認為其「弊大於利」。 在這樣的輿論和好萊塢長年將AI描繪為威脅人類存亡形象的背景下,Google想透過短片資助、科技專家顧問制度及與內容創作者合作,試圖扭轉AI在社會大眾心中的負面形象。 根據《洛杉磯時報》報導,Google近期推動一項名為「AI on Screen」的計畫,攜手好萊塢經紀與製作公司 Range Media Partners,資助描繪人類與科技共存關係的原創短片,試圖在文化戰場上為AI重新定位。 儘管Google強調計畫本質為藝術創作而非公關操作,但外界普遍認為這是在與其他大型科技公司競逐AI主導權之際所進行的形象工程... 👇更深入的完整內容👇 https://www.storm.mg/article/11041447 ■Google/Alphabet:基礎研究與Agentic AI Google的AI策略以其在基礎AI研究(DeepMind、Google AI)的深厚根基為特點,並大力推動開發先進的多模態模型如Gemini,同時日益重視用於規模化企業採用的「Agentic平台」 。該公司採取混合模式,平衡專有產品與對開源研究的貢獻 。 Google AI和DeepMind積極參與前沿AI、基礎機器學習、健康、量子AI、科學和永續性研究 。這種廣泛的研究範圍支撐了其長期的AI願景。 Gemini是Google「最智慧的AI模型」,其變體包括具備深度思考能力的Gemini 2.5(用於複雜數學/編碼)、Gemini Diffusion(更快的內容生成)和Gemini Robotics(用於下一代機器人) 。Gemini for Google Workspace將AI直接嵌入到Gmail、Docs、Sheets和Meet等日常工具中,旨在實現團隊更快、更高效的工作 。 除了文本,Google還開發了Veo(最先進的文本轉影片生成模型,Veo 3更具真實感)、Imagen(最高品質的文本轉圖像模型,Imagen 4已在Gemini應用程式中提供)以及Lyria(文本轉音頻/音樂生成模型) 。 AI Agent被視為將模型轉化為價值的關鍵橋樑,而Google Agentspace則整合了Gemini的先進推理能力、Google品質的搜尋和企業數據,以實現發現、連接和自動化 。例如,Banco BV和Deloitte利用Agentspace為員工提供服務 。 Google強調優化AI堆棧以提高性能和價值,超過70%的組織已從生成式AI中獲得投資回報 。LG AI Research利用Google的TPU和GPU顯著減少了多模態模型的推理處理時間和運營成本 。 Google也為開源研究做出貢獻,並發布了像Gemma這樣的小型開源模型,這反映了其混合策略 。 在實際應用方面,Google的自動駕駛專案Waymo被譽為「當今物理世界中最成熟的AI應用」,已完成1000萬次乘車服務 。這證明了Google將先進AI研究轉化為具體、大規模應用的能力。 Google「研究到應用」的管道與對Agentic AI的押注。Google AI和DeepMind在「前沿AI」、「基礎機器學習」以及廣泛的科學研究領域投入巨資 。它們開發了Gemini、Veo、Imagen和Lyria等尖端模型 。同時,Google高度重視「Agentic平台」的規模化應用 ,並將Gemini整合到Google Workspace中 。Waymo被稱為「物理世界中最成熟的AI應用」 。這表明Google在研究和產品方面都非常強大。Google如何彌合其深奧、通常是理論性的研究與其商業產品之間的鴻溝?「Agentic AI」對Google有何策略意義?研究領域和模型的廣泛列表 展示了Google致力於推動AI科學界限的承諾。將Gemini部署到Workspace 以及開發諸如Gemini Robotics等專用模型 ,清晰地展示了從基礎研究到整合式實用應用的路徑。對「Agentic平台」的關注 是Google對AI下一個演進階段的策略性押注,即模型不僅僅是回應,而是主動行動並與複雜系統和數據互動。這使它們能夠透過自動化複雜的工作流程和彌合數據孤島,將「模型轉化為價值」 。 Google對基礎研究的持續投資 為先進模型和能力提供了穩定的管道。其「Agentic AI」策略旨在透過使模型能夠在企業環境中自主執行多步驟、複雜的任務,最大限度地發揮這些強大模型的效用。這超越了簡單的聊天機器人互動,實現了真正變革性的AI應用,利用了Google在搜尋和數據組織方面的優勢。Waymo的成功 驗證了其在現實世界、高風險場景中實施複雜AI的能力。Google正在將自己定位為下一代AI應用的領導者,其中AI系統不僅是智慧工具,更是複雜問題解決中的活躍、自主參與者。這可能會重新定義企業的運營方式以及用戶與技術的互動方式,走向一個更主動、更智慧的數位環境。 ■OpenAI:前沿模型與AGI追求 OpenAI的核心使命是確保通用人工智慧(AGI)造福全人類,這驅動著其研究和產品開發,旨在創造日益強大且安全的尖端模型 。該公司以非營利組織管理下的獨特「上限利潤」模式運作 。 OpenAI的核心使命是建構「安全且有益的AGI」 。這一長期願景塑造了其研究優先順序。 OpenAI以其GPT-4、DALL-E和Sora等模型而聞名 。最近的進展包括OpenAI o3和o4-mini、GPT-4.5和GPT-4o 。 o系列(推理模型):OpenAI o3是其「最強大的推理模型」,在編碼、數學、科學和視覺感知方面推動了前沿,在Codeforces、SWE-bench和MMMU等基準測試中樹立了新的SOTA(State-of-the-Art) 。OpenAI o4-mini則針對快速、具成本效益的推理進行了優化,在數學、編碼和視覺任務中表現出色,並在AIME 2024/2025中表現良好 。這些模型經過訓練,能夠「在回應前思考更長時間」並有效利用工具 。 GPT系列(多功能模型):GPT-4o專注於「即時跨音頻、視覺和文本進行推理」 。GPT-4.1擅長編碼、精確指令遵循和網頁開發 。GPT-4o的改進強調直覺、創造力、協作和更清晰的溝通風格 。 多模態能力:視覺模型研究包括CLIP和DALL-E 。Sora專注於「透過影片生成模型模擬世界」 。音頻研究則促成了語音識別(Whisper)和原創音樂創作方面的進步 。 安全與對齊:一個重要的關注點是「安全地對齊強大AI系統」,這被認為是其使命中最重要的未解決問題之一,OpenAI積極研究諸如從人類回饋中學習等新技術來解決此問題 。其安全方法涵蓋安全性、隱私、信任和透明度 。 商業化:OpenAI提供ChatGPT(團隊、企業、教育版本)和供開發者使用的API平台等產品 。 OpenAI「研究驅動商業化」與能力對安全性的雙重挑戰。OpenAI的使命是確保AGI造福人類 。他們不斷發布尖端模型(o系列、GPT系列、Sora),這些模型在性能基準上不斷突破 。同時,他們強調「安全地對齊強大AI系統」,並認為這是「最重要的未解決問題」 。這表明OpenAI在建構強大AI的同時,也關注安全性。OpenAI如何平衡其雄心勃勃的AGI使命和快速模型開發與其對安全性的承諾?其「上限利潤」結構有何影響?OpenAI的策略是透過密集的研發 迅速推進AI能力,然後透過ChatGPT和其API等平台迅速將這些前沿模型商業化 。這種「研究驅動商業化」使其能夠資助更雄心勃勃的研究。然而,明確強調「安全地對齊強大AI系統」以及獨特的「由非營利組織管理的上限利潤模式」 揭示了一種根本性的張力。模型的快速進步(例如,「更多運算 = 更好性能」在強化學習中 )本身就產生了新的安全挑戰(例如,意外行為、濫用)。對AGI的追求需要推動AI能力的邊界,這反過來又加劇了安全和對齊研究的複雜性和緊迫性。OpenAI的結構試圖減輕純粹的利潤動機,理論上允許他們優先考慮安全,即使這會影響短期商業收益。模型持續的「改進」 通常反映了不斷努力完善行為並解決諸如「奉承」等問題 ,這表明能力開發和安全改進是一個迭代過程。OpenAI正處於定義「前沿AI」的最前沿,同時也在努力應對這種強大技術所帶來的深遠社會影響。其成功和挑戰將極大地影響全球關於AI治理、倫理和AGI負責任部署的討論,為整個行業樹立先例。 ■Meta AI 系統是指 Meta Platforms, Inc. (前身為 Facebook) 在人工智慧領域所開發和整合的各種技術、模型和應用程式。這是 Meta 公司一個非常重要的發展方向,AI 技術已深入整合到他們的各個產品和服務中。 Meta AI 系統的核心構成與應用 Meta AI 系統的核心目標是透過 AI 技術,提升用戶的數位體驗,使其更智能、個人化且普及。 Llama 系列模型 (大型語言模型 LLMs) Llama 是 Meta 開源的大型語言模型系列,也是 Meta AI 系統的基石。這些模型支援多種功能,例如文本生成、問答系統、對話助理等,並提供高度客製化的開發環境。Meta 持續開發並發布新版本 (例如 Llama 3,並規劃 Llama 4 和 5),旨在打造強大且易於取得的 AI 模型供研究人員和開發者使用。 Meta AI 助理 這是 Meta 直接與其他 AI 聊天機器人 (如 ChatGPT、Gemini、Claude) 競爭的產品。它設計成個人 AI 助理,能協助執行各種任務、回答問題、生成文本和圖像,並提供建議。Meta AI 助理的設計強調個人化回應,它會學習並記住使用者的偏好和興趣,以提供更相關、有用的答案和建議。 跨平台整合 Meta 正將 Meta AI 深度整合到其旗下的熱門應用程式中,包括: Facebook:用於個人化新聞推薦、內容審核和強化搜尋功能。 Instagram:提供自動化照片標記、個人化探索頁面以及改善定向廣告。 WhatsApp:支援智慧回覆、垃圾訊息偵測和聊天機器人互動。 Messenger:強化客服機器人功能和訊息過濾。 這表示使用者可以直接在這些應用程式中存取 AI 助理,以實現從搜尋到內容創作的各種功能。 獨立應用程式與硬體整合 除了現有應用程式,Meta 也推出了獨立的 Meta AI 應用程式,提供專注於與 AI 助理互動的體驗,特別強調語音對話功能。此外,Meta AI 也整合到 Ray-Ban Meta 智慧眼鏡中,讓使用者能透過語音指令與 AI 助理互動,並免持地獲取資訊或協助。 多模態生成能力 Meta AI 系統不僅能生成文本,還支援多模態生成技術,能處理圖像、音訊和視訊。例如,其圖像生成功能允許使用者根據文字提示直接生成客製化圖像。 研究與開發 除了消費者導向的產品,Meta AI 還投入大量精力進行 AI 領域的各項研究,包括自然語言處理、電腦視覺、機器人技術等。例如,他們的 Segment Anything Model (SAM) 能夠「剪下」圖像中的任何物體,而 MEGABYTE 則是一種旨在解決長序列模型挑戰的新型架構。 技術基礎與基礎設施 Meta AI 系統的強大功能建立在先進的技術基礎之上,包括: 自研 AI 加速器 (MTIA):Meta 開發了自家的 AI 訓練和推論加速器 (Meta Training and Inference Accelerator, MTIA),旨在為其獨特的 AI 工作負載提供最高效率的架構,特別是用於推薦系統和生成式 AI 產品。 開放式生態系統:Meta 透過開放 Llama 模型權重等方式,致力於推動 AI 的民主化,讓全球開發者能夠根據自身需求調整模型,加速各行各業的創新。 數據驅動設計:Meta AI 利用社群平台上的公開數據和網路資源進行模型訓練,能夠為使用者提供精確的數據洞察和智慧分析。 挑戰與考量 儘管 Meta AI 帶來了許多便利和創新,但其深度整合到 Meta 平台也引發了對用戶體驗和隱私的討論。Meta 強調在 AI 技術使用中保護用戶隱私和數據安全,並推出了如 Llama Guard 等工具來防止數據濫用和確保內容安全。 總體而言,Meta AI 系統代表了 Meta 公司在人工智慧領域的宏大願景和持續投入,旨在透過 AI 改變人們的數位生活和互動方式。 ■Grok 是一款由 Elon Musk 創立的 xAI 公司開發的人工智慧聊天機器人。它的主要特色和功能包括: 即時資訊獲取:Grok 能夠即時存取網路資訊,特別是與 X(原 Twitter)平台整合,可以獲取最新的新聞、趨勢和即時資料,這使得它在提供時效性資訊方面優於許多依賴靜態訓練資料的 AI 模型。 獨特的語氣和個性:Grok 以其幽默、諷刺和「叛逆」的語氣而聞名,可以處理一些其他 AI 可能會迴避的「敏感」或「有爭議」的問題。它有兩種模式:"Regular Mode"(常規模式)和 "Fun Mode"(趣味模式),使用者可以選擇不同的互動風格。 多模態能力:Grok 不僅能處理文字,還具備多模態能力,例如: Grok Vision:能夠處理視覺資訊,如文件、圖表、圖片、螢幕截圖和照片,並進行分析和理解。 圖像生成:可以根據文字描述生成圖像。 語音模式:支援多語言音訊和實時搜尋。 強大的推理能力:Grok 在數學、科學、程式設計和邏輯推理方面表現出色,尤其是在複雜問題的解決上。Grok 3 版本更強調其「Think」模式,可以像人類一樣進行更深入的思考過程,並提供推理過程。 多功能應用:Grok 能夠執行多種任務,例如: 回答問題 產生創意內容(例如寫作、郵件草稿、代碼) 分析資料 進行研究(DeepSearch 功能) 除錯程式碼 摘要文件 協助事實查核 在台灣的使用情況: Grok 在台灣可以透過其網頁應用程式、iOS 和 Android 應用程式使用。根據台灣使用者分享的經驗,Grok 的即時資訊整合能力受到好評,尤其是在彙整多個網頁內容方面。然而,在處理更深入的研究或專業分析時,可能還未達到專業人士的水準。圖像生成技術被認為是其成熟且表現較好的功能之一。Grok Vision 在物品辨識和翻譯的準確度上仍有進步空間,且目前尚未完全支援繁體中文語音和對話紀錄。 總體而言,Grok 被定位為一個強大、即時且具有獨特個性的 AI 助手,尤其適合那些喜歡帶有幽默感且能快速獲取最新資訊的使用者。 ■〔Google 不再只是搜尋引擎〕 Google #GOOGL 長期以來被視為全球最強大的搜尋引擎,但這個角色正在悄然轉變。根據《連線》雜誌總編輯尼古拉斯·湯普森(Nicholas Thompson)的觀察,Google 正在從一個「搜尋引擎」演變為一個「答案引擎」(Answer Engine)。這個轉變不僅改變了使用者與資訊互動的方式,也對依賴搜尋流量的數位媒體產業帶來了前所未有的衝擊。 Google 從搜尋引擎轉型為答案引擎,標誌著資訊分發模式的根本變革。對媒體而言,這既是挑戰,也是轉機。唯有擁抱變化、創新模式、重視用戶關係,媒體才能在這個AI驅動的資訊時代中找到新的立足點。 ●從搜尋到答案:使用者行為的根本變化 過去,當使用者在 Google 上輸入查詢時,搜尋引擎會提供一系列連結,讓使用者自行點擊、篩選與閱讀。然而,現在的 Google 越來越傾向於直接在搜尋結果頁面上提供「即時答案」,例如知識圖譜(Knowledge Panel)、精選摘要(Featured Snippets)、AI生成的回答(如 Search Generative Experience, SGE)等。 這種「零點擊搜尋」(Zero-click search)現象日益普遍。根據第三方研究機構 SimilarWeb 的數據,超過一半的 Google 搜尋查詢最終不會導致點擊任何連結。這意味著,使用者在搜尋頁面上就已獲得所需資訊,無需再造訪其他網站。 ●媒體業的警訊:搜尋流量急劇下滑 這種趨勢對數位媒體而言無疑是一場地震。長期以來,媒體網站仰賴 Google 的自然搜尋流量(Organic Search Traffic)來吸引讀者、增加廣告曝光與訂閱轉換。然而,這個流量來源正在迅速萎縮。 《赫芬頓郵報》(HuffPost)的自然搜尋流量在過去三年中減少了超過一半。 《華盛頓郵報》(The Washington Post)也經歷了類似的跌幅。 《商業內幕》(Business Insider)在 2022 年 4 月至 2025 年 4 月期間損失了 55% 的自然搜尋流量,並因此裁員 21%。 即使是《紐約時報》(The New York Times)這樣的媒體巨頭,也無法倖免。其來自自然搜尋的流量占比從三年前的近 44% 降至目前的 36.5%。而《華爾街日報》(The Wall Street Journal)雖然總流量有所成長,但來自搜尋的比例仍從 29% 降至 24%。 ●媒體的應對策略:去Google化與直接連結 面對這場流量危機,媒體公司紛紛尋求轉型與自救之道。 《大西洋月刊》(The Atlantic)的執行長公開表示,他們正在計劃將來自 Google 的流量降至零,轉而專注於建立與讀者的直接關係。 《華盛頓郵報》則啟動了「緊急行動」,積極推動電子報、App、會員制度等方式,減少對搜尋引擎的依賴。 Dotdash Meredith,一家擁有多個生活風格品牌的媒體集團,曾有高達 60% 的流量來自 Google,如今這一比例已降至約三分之一。 這些策略的核心在於「擁有自己的受眾」,而不是依賴第三方平台。媒體開始重視第一方數據、社群經營、內容訂閱與品牌忠誠度的培養。 ●Google 的立場與未來方向 Google 並未否認其搜尋產品的演變。事實上,Google 在 2023 年推出的 Search Generative Experience(SGE)正是這一趨勢的具體體現。SGE 利用生成式 AI 技術,直接在搜尋結果中提供完整的答案摘要,甚至整合多個來源的資訊,讓使用者無需點擊即可獲得深入解答。 Google 表示,這樣的設計是為了提升使用者體驗,幫助人們更快、更準確地找到答案。然而,這也引發了媒體與內容創作者的擔憂:如果 Google 自行生成答案,還需要原始內容提供者嗎?他們的流量與收入又該如何保障? ●內容創作者的困境與挑戰 對於依賴廣告收入的內容網站而言,流量就是生命線。當 Google 將答案「截留」在搜尋頁面上,網站的曝光與點擊自然大幅減少。這不僅影響廣告收益,也削弱了品牌影響力與用戶黏著度。 此外,AI生成的答案往往來自於原創內容的彙整與重組,但這些內容創作者卻未必能從中獲得回報。這引發了關於「內容公平使用」與「創作者權益」的激烈討論。 ●未來的媒體生態:去中心化與多元化 儘管挑戰重重,這場轉變也為媒體帶來了重新思考商業模式的契機。未來的媒體生態可能會呈現以下幾個趨勢: 1.去中心化流量來源:媒體將不再過度依賴 Google 或 Facebook,而是發展多元的流量管道,如電子報、Podcast、YouTube、社群平台與自有App。 2.內容即產品:優質內容將不再只是吸引流量的工具,而是直接變現的產品,例如付費訂閱、會員專區、線上課程等。 3.品牌即信任:在資訊爆炸的時代,可信賴的媒體品牌將成為用戶的首選。建立品牌聲譽與專業權威將比SEO更為重要。 4.AI與媒體的共生:媒體也可善用AI工具提升內容生產效率、個人化推薦與互動體驗,與科技共舞而非對抗。
留言
讚
排序方式
最新
最舊
2/8