人工智慧發展的複雜織錦正見證著一條引人入勝且可能至關重要的新線索。Sentient,一家總部位於舊金山、估值高達12億美元的雄心勃勃的AI發展實驗室,已穩步踏入聚光燈下。在最近一個週二下午,該組織揭曉了Open Deep Search (ODS),透過以開源授權釋出其AI搜尋框架,標誌著一個重要的進展。此舉不僅是一次技術發布;它更是一份聲明,是在蓬勃發展的AI驅動資訊檢索領域中擲下的一只戰帖,直接挑戰由產業巨頭提供的既有專有系統。Sentient將ODS定位不僅僅是一個替代方案,而且根據其內部測試,其表現優於著名的封閉源競爭對手,包括備受推崇的Perplexity,甚至OpenAI最近展示的GPT-4o Search Preview。
圍繞ODS的敘事因其獲得Peter Thiel的Founder’s Fund支持而進一步放大,這一細節增添了一層策略上的趣味。Sentient明確將其倡議定位為美國在全球AI競賽中的決定性時刻,暗示它代表了美國對抗中國具影響力的DeepSeek模型的策略性對應。Sentient以非營利實體的名義運作,倡導一種深植於民主化的哲學。其提出的核心論點是,人工智慧的進步,特別是像搜尋這樣的基礎能力,至關重要,不應被限制在以封閉源協議運作的公司所築起的高牆花園內。相反地,Sentient熱情地主張,如此強大的技術「應屬於社群」,以促進協作創新和更廣泛的接觸。因此,這次發布超越了單純的產品推出,將自身定位為一個旨在刻意對抗「封閉AI系統主導地位」的舉措,恰逢美國,在Sentient看來,正達到自身的轉捩點,其自身的「DeepSeek時刻」。
衡量挑戰者:ODS效能指標
Sentient不僅僅是將ODS釋放到野外;它還為其配備了來自內部評估的具說服力的效能數據。用於比較的基準是FRAMES,一個旨在評估AI搜尋系統準確性和推理能力的測試套件。根據Sentient公布的數據,ODS在此基準上達到了驚人的75.3%準確率。當將此結果與其封閉源競爭對手在相同測試環境下的表現並列時,顯得尤為引人注目。
據報導,OpenAI的GPT-4o Search Preview,作為世界領先AI研究實驗室之一的高調產品,在Sentient的測試條件下,於FRAMES基準上得分為50.5%。另一家以其對話式搜尋能力聞名的重要參與者Perplexity Sonar Reasoning Pro,則以**44.4%**的得分進一步落後。雖然承認這些基準測試是由Sentient內部進行的,但所報告的顯著效能差距值得關注。這表明ODS擁有理解查詢、檢索相關資訊並綜合準確答案的複雜能力,可能超越了那些以顯著更多資源開發但保持專有的系統的能力。
在此基準測試過程中採用的方法論對於理解這些結果的背景至關重要。Sentient的共同創辦人Himanshu Tyagi向Decrypt闡明了他們的方法,解釋說FRAMES基準的結構旨在迫使AI模型「從多個來源協調知識」。這意味著焦點不僅僅在於簡單的事實檢索,更在於更複雜的推理和資訊整合任務,模擬現實世界中答案並非整齊地包含在單一來源內的情境。
此外,Sentient刻意選擇提高評估的嚴謹性。為了防止模型依賴易於取得、高度結構化的知識庫,在測試期間,像Wikipedia這樣的「基線事實」來源被特別排除在可存取的數據池之外。正如Tyagi所說,這種策略性的排除迫使AI系統「依賴它們的檢索系統」。其意圖是模擬一個更具挑戰性和現實性的資訊環境,從而提供對模型固有搜尋和綜合能力的「更現實和嚴格的評估」,而不是讓它們依賴預先消化好的資訊快取。這種方法突顯了Sentient對ODS底層檢索和推理機制力量的信心。
拆解引擎:驅動ODS的Agentic框架
根據Sentient的說法,歸功於Open Deep Search的令人印象深刻的基準分數,是其複雜底層架構的產物。在其核心,ODS利用了Sentient所描述的其Open Search Tool,該工具由一個agentic framework(代理框架)驅動。這個概念在先進AI討論中日益普及,意味著一個系統能夠展現比傳統模型更自主、更具目標導向的行為。一個agentic framework不僅僅是處理輸入並生成輸出,它能夠分解複雜任務、制定子查詢、與工具(如搜尋引擎)互動、評估結果,並迭代地調整其策略以達成最終目標——在此案例中,即為用戶的查詢提供最準確的答案。
Himanshu Tyagi對此進行了詳細說明,指出ODS是透過一種「編寫自我修正程式碼的agentic方法」來實現其效能的。這個引人入勝的描述暗示了一個動態過程,其中AI不僅僅是執行一個固定的搜尋演算法。相反地,它似乎是即時生成或精煉其自身的內部程序(「程式碼」),以確定建構全面最終答案所需的步驟和中間問題。這種自我修正機制是關鍵;如果框架最初未能檢索到關鍵資訊,它不會簡單地放棄或提供不完整的答案。相反地,它會識別出差距並自主地「再次呼叫搜尋工具」,但這次是帶著一個「更具體的查詢」,旨在明確地檢索缺失的精確資訊。
這種迭代式的精煉過程對於處理複雜或模糊的搜尋請求至關重要。但是,當系統遇到更頑固的障礙時——也許是相互矛盾的資訊、索引不佳的網頁,或者僅僅是缺乏現成可用的數據——會發生什麼?Tyagi解釋說,該模型採用了一套先進技術來應對這些挑戰。這些技術包括:
- 增強型查詢改寫 (Enhanced Query Rephrasing): 系統智慧地以多種方式重新表述用戶的初始查詢或其自身的子查詢,以探索資訊領域的不同面向,並克服潛在的關鍵字不匹配問題。
- 多遍檢索 (Multi-Pass Retrieval): ODS不依賴單一的搜尋掃描,而是可以執行多輪資訊收集,可能在每一遍中使用不同的策略或專注於查詢的不同方面,以建立更完整的圖像。
- 智慧分塊與重排序 (Intelligent Chunking and Reranking): 在處理來自網頁或文件的大量文本時,系統不僅僅是攝取原始數據。它智慧地將內容分解成有意義的片段(「分塊」),然後根據這些片段與特定資訊需求的相關性對其進行優先排序(「重排序」),確保最相關的細節被提取和綜合。
這種結合了agentic、自我修正核心與複雜檢索和處理技術的架構,描繪出一個高度適應性且強健的搜尋框架。為了促進透明度並使社群能夠進行審查和貢獻,Sentient已透過其GitHub儲存庫公開了ODS及其評估細節,邀請全球的開發者和研究人員來檢視、利用並可能改進他們的工作。
意識形態的潛流:在AI時代倡導開放性
Sentient決定以非營利組織形式運作並以開源授權發布ODS,遠不止是一種商業策略;它是在關於人工智慧未來治理的持續辯論中宣告原則。該公司的立場毫不含糊:AI的發展軌跡,這些有潛力深刻重塑社會的技術,「應屬於社群,而非由封閉源公司控制」。這種哲學呼應了科技界悠久的傳統,與產生了像Linux和Apache網頁伺服器等基礎技術的開源軟體運動遙相呼應。
將AI開源,特別是像先進搜尋框架這樣強大的工具,其論點建立在幾個支柱之上:
- 民主化 (Democratization): 開放取用讓小型公司、學術研究人員、獨立開發者甚至業餘愛好者能夠利用、研究和建立在尖端AI之上,而無需支付高昂的授權費用或受限於嚴格的使用條款。這可以促進來自意想不到角落的創新,並拉平競爭環境。
- 透明度與審查 (Transparency and Scrutiny): 封閉源模型如同「黑盒子」般運作,使外部各方難以理解其偏見、限制或潛在的失敗模式。開源允許同行評審、審計和協作除錯,可能導致更安全、更可靠的系統。
- 防止壟斷 (Preventing Monopolies): 隨著AI在各行各業中日益核心化,將控制權集中在少數大公司手中引發了對市場主導地位、審查制度和潛在濫用的擔憂。開源提供了一種制衡力量,促進了更分散、更具韌性的AI生態系統。
- 加速進步 (Accelerated Progress): 透過允許他人在現有工作基礎上自由建構,開源可能加速創新的步伐。共享知識和協作開發可能比孤立的、專有的努力更快地帶來突破。
然而,AI領域的開源方法並非沒有其自身的挑戰和反駁論點。擔憂通常圍繞著安全性(如果強大的模型可自由獲取,可能被濫用)、在沒有專有貨幣化的情況下資助大規模AI開發的困難,以及如果多個不相容的版本激增可能導致的碎片化。
Sentient透過ODS採取的行動,明確地站在了倡導開放性作為首選前進道路的一方,直接挑戰了許多領先AI實驗室(如OpenAI(儘管其名稱如此,但其許多最先進的模型並非完全開放)、Google DeepMind和Anthropic)中普遍存在的模式。透過將ODS定位為一個在非營利、開源模式下開發的高效能替代方案,Sentient旨在證明這種方法不僅可行,而且在提供強大、易於取得的AI工具方面可能更優越。他們的成功與否,可能會顯著影響關於人類應如何管理日益智慧化機器發展的更廣泛辯論。
DeepSeek的對照:這是美國的開源轉捩點嗎?
Sentient明確將ODS的發布定位為美國對中國DeepSeek的回應,為此公告增添了一層地緣政治和戰略意義。DeepSeek,一個在中國開發的開源模型,在其出現時引起了全球相當大的關注,特別是在一月份左右。它的能力證明了高效能的AI開發,在全球層面上具有競爭力,確實可以在開源範式內蓬勃發展,挑戰了AI領導地位必須透過嚴密、專有控制才能實現的觀念。
這種比較表明,Sentient不僅將其工作視為技術進步,而且是確保美國在特定開源AI領域保持競爭力和影響力的關鍵一步。這個領域被視為日益重要,與由老牌大型科技公司主導的封閉源開發有所區別。為什麼這個「DeepSeek時刻」被認為如此關鍵?Decrypt在DeepSeek首次引起轟動時諮詢的NYU Shanghai教授Bogna Konior提供的評論,提供了深刻的見解。
Konior強調了當前AI發展的變革性,指出:「我們現在常規性地讓AI草擬我們的思想——這是一個與語言本身的發明同樣非凡的發展。」這個強有力的類比突顯了隨著AI深度融入人類認知過程而發生的根本性轉變。她進一步闡述:「就好像人類正在電腦內部重新創造語言發明的那個關鍵時刻。」這種觀點大大提高了賭注。如果AI代表了一種新形式的「語言」或認知工具,那麼誰控制其發展和傳播的問題就變得至關重要。
在DeepSeek和Sentient的ODS之間所做的類比,突顯了這些哲學和戰略上的轉變。兩者都代表了來自主要全球科技中心、旨在推動強大AI能力開源可及性的重大努力。Konior關於開源技術本質的觀察在這裡引起了強烈共鳴:「一旦開源技術被釋放到世界上,它就無法被遏制。」開源的這種固有特性——其以創造者無法預見的方式擴散、適應和整合的趨勢——既是它的力量,對某些人來說,也是它被感知的風險。
由Thiel的Founder’s Fund支持的Sentient顯然相信,擁抱這種動態不僅是必要的,而且對美國有利。透過推出ODS,他們不僅僅是釋出程式碼;他們是在爭奪開源AI運動的領導地位,表明美國能夠並且應該在這個領域積極競爭,培養一個獨立於、並可能挑戰封閉源巨頭的生態系統。他們正在斷言,由強大的開放平台催化的、廣泛的、社群驅動的AI創新時刻,確實已經為美國到來。
Founder’s Fund的影響力:Peter Thiel對開放AI的押注
Peter Thiel的Founder’s Fund作為Sentient的支持者參與其中,為ODS的故事增添了一個重要的維度。Thiel是Silicon Valley一位著名且常持異見的人物,以其投資常反映獨特世界觀、頻繁挑戰既定規範和現有企業而聞名。他的基金支持像Sentient這樣的非營利、開源AI倡議值得更仔細地審視。
雖然Founder’s Fund投資於各種技術領域,但Thiel本人對AI表達過複雜的看法,包括對其潛在危險的擔憂以及對圍繞它的一些炒作持懷疑態度。然而,支持一個開源項目可能符合幾種潛在的戰略或意識形態動機:
- 顛覆現有企業 (Disrupting Incumbents): Thiel有支持旨在顛覆大型、老牌企業的風險投資歷史。支持一個高效能的開源替代方案,以對抗Google、Microsoft(透過OpenAI)等公司正在開發的AI搜尋工具,符合這種模式。它代表了一個潛在的槓桿,可以在一個關鍵的新興領域挑戰大型科技公司的統治地位。
- 促進競爭 (Promoting Competition): 開源方法透過降低進入門檻,本質上促進了競爭。這可以被視為確保一個更具活力、更少中心化的AI格局的方式,防止權力集中在少數企業實體手中。
- 地緣政治策略 (Geopolitical Strategy): 鑑於ODS被定位為美國的「DeepSeek時刻」,這項投資可以從國家競爭力的角度來看待。支持一個領先的美國開源AI項目,加強了國家在這場全球技術競賽中的地位。
- 探索替代模式 (Exploring Alternative Models): 投資於一個專注於開源開發的非營利結構,允許探索不同的技術進步模式,可能找到既具創新性又較少受到純粹利潤驅動、封閉源開發所感知到的缺點影響的路徑。
- 接觸與影響力 (Access and Influence): 即使沒有從非營利組織本身獲得直接利潤,支持Sentient也為Founder’s Fund提供了對尖端AI發展的洞察力,以及在蓬勃發展的開源AI社群中的影響力。
具體的動機仍然是推測性的,但一個以戰略性、常持異見的押注而聞名的高知名度風險投資基金,與一個倡導開源AI的非營利組織結盟,是值得注意的。這表明了一種信念,即開源模式不僅在哲學上具有吸引力,而且在AI時代可能成為技術進步和市場顛覆的強大力量。它標誌著大量資本願意支持封閉源範式的替代方案,為Sentient所倡導的意識形態論點增添了財務實力。
重新定義搜尋:ODS在演變中的資訊景觀
Open Deep Search的出現,正值「搜尋」這一概念本身經歷深刻轉變的時刻,這主要是由人工智慧的進步所驅動。幾十年來,搜尋一直由Google完善的基於關鍵字的範式主導——用戶輸入術語,引擎返回一個排序的相關文件連結列表。雖然有效,但這種模式通常需要用戶篩選多個來源來綜合答案。
像Perplexity、GPT-4o的搜尋能力,以及現在Sentient的ODS這樣的AI驅動搜尋工具,代表了向更具對話性和綜合性方法的轉變。這些系統不僅僅是提供連結,它們旨在直接回答問題、總結來自多個來源的資訊、進行對話,甚至根據檢索到的資訊執行任務。ODS憑藉其agentic framework,似乎旨在於這種新範式中脫穎而出。它改寫查詢、執行多遍檢索和智慧綜合資訊的能力,表明其專注於理解用戶意圖並提供全面的答案,而不僅僅是相關的連結。
與其封閉源競爭對手相比,ODS的開放性提供了明顯的潛在優勢和劣勢:
潛在優勢:
- 客製化與整合 (Customization and Integration): 開發者可以自由修改ODS,將其深度整合到自己的應用程式中,或針對特定領域或任務進行微調,這是專有API無法做到的。
- 透明度 (Transparency): 用戶和開發者可以檢查程式碼以了解其運作方式、偏見和限制。
- 成本 (Cost): 作為開源軟體,核心技術可免費使用,可能降低部署先進搜尋能力的成本。
- 社群增強 (Community Enhancement): 該框架可以受益於全球社群的貢獻,可能導致更快的改進和更廣泛的功能集。
潛在劣勢:
- 支援與維護 (Support and Maintenance): 開源項目可能缺乏商業產品那樣的專門、集中的支援結構。
- 資源密集度 (Resource Intensity): 運行像ODS這樣複雜的AI模型可能需要大量的計算資源,這可能限制了某些用戶的可及性。
- 開發速度 (Pace of Development): 雖然社群貢獻可以加速開發,但進展有時可能不如企業環境中那樣可預測或協調。
- 貨幣化挑戰 (Monetization Challenges): 維持大規模開源項目的開發和基礎設施需要可行的資金模型,這對非營利組織來說可能是一個挑戰。
ODS進入了一個用戶期望迅速演變的競爭領域。成功不僅取決於基準效能,還取決於易用性、整合能力、速度、可靠性以及處理現實世界資訊需求的細微差別和複雜性的能力等因素。透過提供一個開放、高效能的替代方案,Sentient旨在開闢一個重要的利基市場,並可能影響AI搜尋發展的軌跡,使其朝向更大的可及性和社群參與。
前進之路:開源AI搜尋的前景與障礙
Sentient推出Open Deep Search標誌著一個重要的里程碑,但這是一個旅程的開始,而非終點。ODS和更廣泛的開源AI搜尋運動的未來影響,取決於能否在充滿機遇與挑戰的複雜景觀中航行。
機遇:
- 賦能創新 (Empowering Innovation): ODS提供了一個強大的工具包,可以在各個領域釋放創新。新創公司可以為利基領域(例如科學研究、法律先例、金融分析)建立專門的搜尋引擎,而無需在核心AI開發上投入巨額前期投資。
- 學術進步 (Academic Advancement): 研究人員獲得了一個最先進的框架,用於研究資訊檢索、自然語言處理和agentic AI系統,可能加速學術進展。
- 增強型數位助理 (Enhanced Digital Assistants): ODS可以整合到開源數位助理或其他應用程式中,提供更複雜、具備情境感知能力的資訊功能。
- 挑戰市場集中 (Challenging Market Concentration): 一個成功的ODS可以真正挑戰現有參與者的主導地位,促進一個更具競爭力和多元化的資訊取用工具市場。
- 建立信任 (Building Trust): 開源固有的透明度有助於建立用戶信任,這是隨著AI系統日益融入日常生活和決策過程中的一個關鍵因素。
挑戰:
- 採用與社群建立 (Adoption and Community Building): 成功取決於吸引一個充滿活力的開發者和用戶社群來採用、貢獻並建立在ODS之上。這需要有效的推廣、文件編寫和社群管理。
- 計算成本 (Computational Costs): 運行和進一步訓練大型AI模型的計算成本高昂。確保可及性需要找到優化效能的方法,並可能提供負擔得起的計算資源。
- 跟上步伐 (Keeping Pace): AI領域正以驚人的速度發展。ODS需要持續的開發和改進,才能與資金充足、快速迭代的封閉源替代方案保持競爭力。
- 資金可持續性 (Funding Sustainability): 作為一個非營利組織,Sentient需要一個可持續的資金模型來支持ODS的持續研究、開發、基礎設施和社群支援。依賴撥款或捐贈可能不穩定。
- 安全與負責任使用 (Safety and Responsible Use): 與任何強大的AI一樣,確保負責任的使用並減輕潛在危害(例如生成錯誤資訊、強化偏見)至關重要,在分散式、開源的背景下可能更為複雜。
- 基準戰爭 (Benchmark Wars): 過度依賴特定基準可能具有誤導性。在多樣化任務和用戶需求中的真實世界表現將是最終的考驗。
Sentient的ODS代表了在AI發展最關鍵領域之一對開放力量的大膽押注。它的旅程將受到密切關注。如果它成功地培養了一個蓬勃發展的生態系統,並展示了持續的高效能,它可能會顯著重塑資訊取用的未來,證明社群驅動的、開放的開發確實可以與封閉源世界的巨頭競爭,甚至可能超越它們。Sentient所宣稱的「DeepSeek時刻」可能真的正在進行中,開啟了人工智慧演進的新篇章。