De Opkomst van het Agent Concept
De afgelopen jaren heeft het Agent (intelligentie) domein ongekende aandacht gekregen van de markt, met gebeurtenissen zoals de lancering van de GitHub MCP server door Microsoft, de publicatie van het A2A intelligentie communicatieprotocol door Google en de lancering van de MCP server door Alipay. Hoewel er momenteel nog geen volledige consensus is over de definitie van Agent, worden de drie kerncomponenten ‘planning’, ‘geheugen’ en ‘gebruik van tools’, voorgesteld door voormalig OpenAI onderzoeker Lilian Weng, algemeen erkend en vormen ze de sleutel tot het begrijpen van Agent.
In het veld van kunstmatige intelligentie is het concept van Agent niet nieuw, maar met de snelle ontwikkeling van grote taalmodellen (LLM’s) hebben de toepassingsvooruitzichten van Agent een nieuwe doorbraak bereikt. Een Agent kan worden gezien als een intelligent systeem dat de omgeving kan waarnemen, autonoom kan plannen en taken kan uitvoeren. De kern ervan ligt in het vermogen om menselijke besluitvormingsprocessen te simuleren en verschillende tools en middelen te gebruiken om de gestelde doelen te bereiken.
De Huidige Staat van Agent Ontwikkeling: Enorm Potentieel, Lage Penetratiegraad
Als een evolutie van chatbots worden de huidige Agent toepassingen meestal geïntegreerd in de betaalde diensten van grote modellen. Slechts enkele Agents, zoals Manus en Devin, bieden onafhankelijke betaalde diensten. Desondanks zijn er nog steeds veel beperkingen bij het gebruik van Agents met autonome planningsmogelijkheden zoals Deep Research en Manus. Het aantal gebruikers dat ze daadwerkelijk kan ervaren is mogelijk niet groot en er is nog veel ruimte voor verbetering voordat er een ‘kaskraker’ applicatie verschijnt.
Echter, met de voortdurende verbetering van de redeneervermogens van grote modellen, wordt Agent geleidelijk een focus van applicatie-innovatie. Steeds meer ontwikkelaars en onderzoekers beginnen de toepassing van Agent in verschillende domeinen te onderzoeken, zoals intelligente assistenten, geautomatiseerde processen, data-analyse, enzovoort. Het potentieel van Agent wordt geleidelijk ontdekt en de toekomstige ontwikkelingsruimte is enorm.
Grootschalige Agent Toepassing Staat Voor De Deur: Gedreven Door Meerdere Gunstige Voorwaarden
Doorbraken aan de Kant van de Model Training
- Context Window Groeit Snel: Het context window van een groot model verwijst naar de maximale tekstlengte die het model kan overwegen bij het verwerken van tekst. Met de technologische vooruitgang groeit het context window van modellen snel, wat betekent dat het model de context van lange teksten beter kan begrijpen, waardoor nauwkeurigere beslissingen kunnen worden genomen.
- Diepgaande Toepassing van Reinforcement Learning: Reinforcement learning is een methode om Agents te trainen door middel van beloningen en straffen. De afgelopen jaren is reinforcement learning op grote schaal toegepast bij de training van Agents, waardoor Agents zich beter kunnen aanpassen aan complexe omgevingen en de optimale strategie kunnen leren.
- Redeneermodellen Worden Steeds Volwassener: Het redeneermodel is de kerncomponent van een Agent en is verantwoordelijk voor het redeneren en beoordelen op basis van de ingevoerde informatie. Met de verdieping van het onderzoek worden redeneermodellen steeds volwassener en kunnen ze de verschillende toepassingen van Agents beter ondersteunen.
Bloeiend Ecosysteem
- MCP en A2A Protocollen Ontwikkelen Zich Snel: MCP (Model Communication Protocol) en A2A (Agent-to-Agent) zijn twee belangrijke Agent communicatieprotocollen. De snelle ontwikkeling van deze protocollen maakt het voor Agents gemakkelijker om verschillende tools en diensten aan te roepen, waardoor complexere functies mogelijk worden.
- Agent Kan Gemakkelijker Tools Aanroepen: Met de technologische vooruitgang wordt de manier waarop Agents externe tools en diensten aanroepen steeds handiger. Via API’s (Application Programming Interfaces) kan een Agent bijvoorbeeld gemakkelijk toegang krijgen tot verschillende databronnen en online diensten, waardoor zijn eigen mogelijkheden worden uitgebreid.
In november 2024 publiceerde en opende Anthropic het MCP-protocol, dat tot doel heeft te standaardiseren hoe externe gegevens en tools context bieden aan modellen. Deze actie zal de ontwikkeling van het Agent-ecosysteem aanzienlijk bevorderen, waardoor Agents externe middelen beter kunnen benutten.
MCP en A2A: De Sleutel tot Agent Interconnectie
MCP Protocol: Verbindt Agent met de Externe Wereld
Het belangrijkste doel van het MCP-protocol is om ‘one-click interconnectie’ te realiseren tussen Agent en externe data en tools. Via het MCP-protocol heeft Agent gemakkelijk toegang tot verschillende externe bronnen, zoals databases, API’s, webservices, enzovoort. Hierdoor kan Agent de omgeving beter begrijpen en slimmere beslissingen nemen.
A2A Protocol: Bouwt een Communicatiebrug tussen Agents
Het doel van het A2A-protocol is om communicatie tussen Agents te realiseren. Via het A2A-protocol kunnen Agents samenwerken om complexe taken te voltooien. Dit is van groot belang voor het bouwen van gedistribueerde intelligente systemen.
Hoewel het doel van het A2A-protocol communicatie tussen Agents is, en MCP voor Agent met externe tools en data, kunnen de functies van beide overlappen in de complexe situatie waarin ‘tools ook kunnen worden ingekapseld als Agent’, maar deze concurrentie helpt de kosten van het aanroepen van externe tools en communicatie door grote modellen te verlagen. Deze concurrentie zal de technologische vooruitgang stimuleren en uiteindelijk het hele Agent-ecosysteem ten goede komen.
Agent Ontwikkelingsvooruitzichten
End-to-End Agent: Geen Menselijke Interventie Nodig
Momenteel zijn er veel ‘intelligenties’ op de markt, maar een aanzienlijk deel daarvan is ontwikkeld op basis van platforms zoals Coze en Dify, waarvoor mensen vooraf een workflow moeten schrijven. Deze Agents lijken meer op een opeenstapeling van prompt engineering en behoren tot de meer elementaire Agents.
Een meer geavanceerde Agent is ‘end-to-end’, wat betekent ‘voer een taak in voor de Agent en de Agent voltooit automatisch de door de mens vereiste taakresultaten’. Een gebruiker hoeft bijvoorbeeld alleen maar een doel in te voeren voor de Agent, waarna de Agent autonoom kan plannen en taken kan uitvoeren en uiteindelijk het doel kan voltooien. L3/L4/L5 en andere dergelijke geavanceerde Agents voldoen beter aan de menselijke behoeften en zullen een belangrijke richting worden voor de toekomstige ontwikkeling van Agents.
Agent Helpt Robots en Autonoom Rijden
Wanneer de definitie van Agent wordt toegepast op belichaamde intelligentie, zal men ontdekken dat robots en voertuigen die worden gedomineerd door grote modellen, ook Agents zijn. Vooral robots, de huidige knelpunten in de robotontwikkeling liggen niet in het ‘hoe je fysieke bewegingen maakt’ ‘kleine hersenen’, maar in het nadenken over ‘welke fysieke bewegingen je maakt’ ‘grote hersenen’, en dit valt precies binnen het bereik van Agent.
Op het gebied van robots kan Agent robots helpen de omgeving beter te begrijpen en redelijkere beslissingen te nemen. Agent kan bijvoorbeeld de bewegingsroute van de robot autonoom plannen en verschillende taken uitvoeren op basis van objecten en mensen in de omgeving.
Op het gebied van autonoom rijden kan Agent voertuigen helpen de omgeving beter waar te nemen en veiligere rijbeslissingen te nemen. Agent kan bijvoorbeeld de snelheid en richting van het voertuig autonoom aanpassen op basis van verkeerslichten, andere voertuigen en voetgangers, waardoor verkeersongevallen worden voorkomen.
Agent Interconnectie en AI Native Network
In de toekomst zouden misschien alle Agents met elkaar moeten kunnen communiceren, zelf kunnen organiseren en onderhandelen, om een samenwerkingsnetwerk te bouwen dat goedkoper en efficiënter is dan het huidige internet. De Chinese ontwikkelaarsgemeenschap bouwt ook protocollen zoals ANP, die tot doel hebben het HTTP-protocol van het Agent internettijdperk te worden. En over de identiteitsverificatie tussen Agents kan gebruik worden gemaakt van technologieën zoals DID.
- Agent Interconnectie: Interconnectie tussen Agents kan het delen van middelen en samenwerking realiseren, waardoor de efficiëntie van het hele systeem wordt verbeterd. Verschillende Agents kunnen bijvoorbeeld data, tools en diensten delen om samen complexe taken te voltooien.
- AI Native Network: AI Native Network verwijst naar een netwerk dat speciaal is ontworpen voor kunstmatige intelligentie toepassingen. Dit netwerk kan een hogere bandbreedte, lagere latency en sterkere beveiliging bieden, waardoor de verschillende toepassingen van Agent beter worden ondersteund.
- DID Technologie: DID (Decentralized Identifier) is een gedecentraliseerde identiteitsverificatietechnologie. Via DID-technologie kan Agent zijn eigen identiteit hebben, waardoor veiligere en betrouwbaardere communicatie mogelijk wordt.
De ontwikkeling van Agent-technologie zal enorme veranderingen met zich meebrengen. Het toekomstige internet zal niet langer een eenvoudig netwerk voor informatieoverdracht zijn, maar een samenwerkingsnetwerk vol intelligentie.