Przemyślenia o benchmarkach AI
Czy wyniki benchmarków AI rzeczywiście odzwierciedlają możliwości w realnym świecie? Społeczność AI zmaga się z tym pytaniem w obliczu rosnącej krytyki tradycyjnych benchmarków.
Czy wyniki benchmarków AI rzeczywiście odzwierciedlają możliwości w realnym świecie? Społeczność AI zmaga się z tym pytaniem w obliczu rosnącej krytyki tradycyjnych benchmarków.
Porównanie chatbotów AI: ChatGPT, Gemini, Perplexity i Grok w głębokich badaniach. Który z nich jest najlepszy w analizie danych i dostarczaniu szczegółowych raportów?
Apple bada AI w Safari wobec obaw o partnerstwo z Google. Rozważają OpenAI, Anthropic i Perplexity.
Clippy powraca! Kultowy asystent Microsoft Office odzyskuje blask dzięki AI, stając się pomocnym towarzyszem.
Shin Yong-tak ogłasza sukces testów AGI EchoCore, integrującego emocje. System dąży do autonomii etycznej i rozumienia emocjonalnego.
ERNIE Bot od Baidu symbolizuje chiński opór przeciwko ograniczeniom USA w dziedzinie AI. Chiny rozwijają własny ekosystem AI i omijają sankcje, inwestując w innowacje.
Hugging Face prezentuje Open Computer Agent, eksperymentalny projekt AI zdolny do obsługi zadań na komputerze. Obecnie bardziej demonstracja możliwości niż funkcjonalny asystent.
Fidji Simo, była CEO Instacart, dołącza do OpenAI jako szefowa Applications. Będzie kierować rozwojem i wdrażaniem aplikacji AI, raportując bezpośrednio do Sama Altmana.
Li Auto wprowadza model VLA, rewolucjonizując interakcję AI ze światem fizycznym. Koncepcja "kierowcy dużego modelu" i integracja wizji, języka i działania.
Microsoft i Google połączyły siły, aby rozwinąć Agent2Agent (A2A), protokół komunikacji agentów AI, wspierając interoperacyjność.