ఎంటర్‌ప్రైజ్ AI యాప్‌ల నిర్మాణం

ఫైన్-ట్యూనింగ్ యొక్క భ్రమ

ఫైన్-ట్యూనింగ్ మరియు రిట్రీవల్ ఆగ్మెంటెడ్ జనరేషన్ (RAG) సాధారణంగా ముందుగా శిక్షణ పొందిన AI మోడల్స్ యొక్క జ్ఞానం మరియు సామర్థ్యాలను మెరుగుపరచడానికి బాగా స్థిరపడిన పద్ధతులుగా పరిగణించబడతాయి. అయితే, Aleph Alpha CEO జోనాస్ ఆండ్రులిస్ వాస్తవికత మరింత క్లిష్టంగా ఉంటుందని ఎత్తి చూపారు.

“ఒక సంవత్సరం క్రితం, ఫైన్-ట్యూనింగ్ అనేది ఒక మాయా పరిష్కారం అనే విస్తృత నమ్మకం ఉంది. ఒక AI సిస్టమ్ కోరుకున్న విధంగా పని చేయకపోతే, సమాధానం కేవలం ఫైన్-ట్యూనింగ్ మాత్రమే. ఇది అంత సులభం కాదు” అని అతను వివరించాడు.

ఫైన్-ట్యూనింగ్ ఒక మోడల్ యొక్క శైలిని లేదా ప్రవర్తనను మార్చగలిగినప్పటికీ, కొత్త సమాచారాన్ని బోధించడానికి ఇది అత్యంత ప్రభావవంతమైన విధానం కాదు. ఫైన్-ట్యూనింగ్ మాత్రమే అన్ని AI అప్లికేషన్ సమస్యలను పరిష్కరించగలదనే అంచనా ఒక అపోహ.

RAG: ఒక ప్రత్యామ్నాయ విధానం

RAG బాహ్య ఆర్కైవ్ నుండి సమాచారాన్ని పొందే లైబ్రేరియన్ లాగా పనిచేయడం ద్వారా ప్రత్యామ్నాయాన్ని అందిస్తుంది. ఈ విధానం మోడల్‌కు రీట్రైనింగ్ లేదా ఫైన్-ట్యూనింగ్ చేయకుండానే డేటాబేస్ ‌లోని సమాచారానికి నవీకరణలు మరియు మార్పులను అనుమతిస్తుంది. అదనంగా, ఉత్పత్తి చేయబడిన ఫలితాలు ఖచ్చితత్వం కోసం ఉదహరించబడతాయి మరియు ఆడిట్ చేయబడతాయి.

“నిర్దిష్ట జ్ఞానం ఎల్లప్పుడూ డాక్యుమెంట్ చేయబడాలి మరియు LLM యొక్క పారామితులలో నిల్వ చేయబడకూడదు” అని ఆండ్రులిస్ నొక్కిచెప్పారు.

RAG అనేక ప్రయోజనాలను అందిస్తున్నప్పటికీ, దాని విజయం మోడల్ అర్థం చేసుకోగలిగే ఫార్మాట్‌లో కీలక ప్రక్రియలు, విధానాలు మరియు సంస్థాగత జ్ఞానం యొక్క సరైన డాక్యుమెంటేషన్‌పై ఆధారపడి ఉంటుంది. దురదృష్టవశాత్తు, ఇది తరచుగా జరగదు.

డాక్యుమెంటేషన్ ఉన్నప్పటికీ, పత్రాలు లేదా ప్రక్రియలు అవుట్-ఆఫ్-డిస్ట్రిబ్యూషన్ డేటాపై ఆధారపడి ఉంటే-బేస్ మోడల్‌కు శిక్షణ ఇవ్వడానికి ఉపయోగించిన డేటాకు భిన్నంగా ఉండే డేటా-ఎంటర్‌ప్రైజ్‌లు సమస్యలను ఎదుర్కోవచ్చు. ఉదాహరణకు, పూర్తిగా ఇంగ్లీష్ డేటాసెట్‌లపై శిక్షణ పొందిన మోడల్ జర్మన్ డాక్యుమెంటేషన్‌తో పోరాడుతుంది, ప్రత్యేకించి అందులో శాస్త్రీయ సూత్రాలు ఉంటే. చాలా సందర్భాలలో, మోడల్ డేటాను అస్సలు అర్థం చేసుకోలేకపోవచ్చు.

అందువల్ల, అర్థవంతమైన ఫలితాలను సాధించడానికి సాధారణంగా ఫైన్-ట్యూనింగ్ మరియు RAG కలయిక అవసరమని ఆండ్రులిస్ సూచిస్తున్నారు. ఈ హైబ్రిడ్ విధానం వాటి వ్యక్తిగత పరిమితులను అధిగమించడానికి రెండు పద్ధతుల యొక్క బలాన్ని పెంచుతుంది.

అంతరాన్ని తగ్గించడం

ఎంటర్‌ప్రైజ్‌లు మరియు దేశాలు తమ సొంత సార్వభౌమ AIలను అభివృద్ధి చేయకుండా నిరోధించే సవాళ్లను పరిష్కరించడం ద్వారా యూరోపియన్ డీప్‌మైండ్‌గా నిలవాలని Aleph Alpha లక్ష్యంగా పెట్టుకుంది.

సార్వభౌమ AI అనేది ఒక దేశం యొక్క అంతర్గత డేటాసెట్‌లను ఉపయోగించి దాని సరిహద్దుల్లో నిర్మించిన లేదా అమలు చేయబడిన హార్డ్‌వేర్‌పై శిక్షణ పొందిన లేదా ఫైన్-ట్యూన్ చేయబడిన మోడల్‌లను సూచిస్తుంది. ఈ విధానం డేటా గోప్యత, భద్రత మరియు నియంత్రణను నిర్ధారిస్తుంది, ఇవి అనేక సంస్థలు మరియు ప్రభుత్వాలకు కీలకం.

“ఎంటర్‌ప్రైజ్‌లు మరియు ప్రభుత్వాలు తమ సొంత సార్వభౌమ AI వ్యూహాన్ని రూపొందించడానికి మేము ఆపరేటింగ్ సిస్టమ్, పునాదిగా ఉండటానికి ప్రయత్నిస్తాము” అని ఆండ్రులిస్ పేర్కొన్నారు. “అవసరమైన చోట ఆవిష్కరణలు చేయాలని మేము లక్ష్యంగా పెట్టుకున్నాము, అదే సమయంలో ఓపెన్ సోర్స్ మరియు అత్యాధునిక సాంకేతిక పరిజ్ఞానాలను కూడా సాధ్యమైనంత వరకు ఉపయోగించుకుంటాము.”

ఇది అప్పుడప్పుడు Aleph యొక్క Pharia-1-LLM వంటి మోడల్‌లకు శిక్షణ ఇవ్వడంలో పాల్గొంటున్నప్పటికీ, వారు Llama లేదా డీప్‌సీక్ వంటి ఇప్పటికే ఉన్న మోడల్‌లను నకిలీ చేయడానికి ప్రయత్నించడం లేదని ఆండ్రులిస్ నొక్కి చెప్పారు. వారి దృష్టి నిర్దిష్ట సవాళ్లను పరిష్కరించే ప్రత్యేక పరిష్కారాలను రూపొందించడంపై ఉంది.

“ప్రతి ఒక్కరూ చేస్తున్న పనిని కాపీ చేయడమే కాకుండా, అర్ధవంతంగా విభిన్నమైన విషయాలపై దృష్టి పెట్టాలని నేను ఎల్లప్పుడూ మా పరిశోధనను నిర్దేశిస్తాను, ఎందుకంటే అది ఇప్పటికే ఉంది” అని ఆండ్రులిస్ చెప్పారు. “మేము మరొక Llama లేదా డీప్‌సీక్‌ను నిర్మించాల్సిన అవసరం లేదు ఎందుకంటే అవి ఇప్పటికే ఉన్నాయి.”

బదులుగా, Aleph Alpha ఈ సాంకేతిక పరిజ్ఞానాలను స్వీకరించడాన్ని సులభతరం చేసే మరియు క్రమబద్ధీకరించే ఫ్రేమ్‌వర్క్‌లను నిర్మించడంపై దృష్టి పెడుతుంది. ఇటీవలి ఉదాహరణ వారి కొత్త టోకనైజర్-ఫ్రీ, లేదా “T-Free,” శిక్షణా ఆర్కిటెక్చర్, ఇది అవుట్-ఆఫ్-డిస్ట్రిబ్యూషన్ డేటాను మరింత సమర్థవంతంగా అర్థం చేసుకోగల మోడల్‌లను ఫైన్-ట్యూన్ చేయడం లక్ష్యంగా పెట్టుకుంది.

సాంప్రదాయ టోకనైజర్-ఆధారిత విధానాలకు తరచుగా పెద్ద మొత్తంలో అవుట్-ఆఫ్-డిస్ట్రిబ్యూషన్ డేటా అవసరమవుతుంది, తద్వారా మోడల్‌ను సమర్థవంతంగా ఫైన్-ట్యూన్ చేయవచ్చు. ఇది గణనపరంగా ఖరీదైనది మరియు తగినంత డేటా అందుబాటులో ఉందని ఊహిస్తుంది.

Aleph Alpha యొక్క T-Free ఆర్కిటెక్చర్ టోకనైజర్‌ను తొలగించడం ద్వారా ఈ సమస్యను అధిగమిస్తుంది. ఫిన్నిష్ భాషలో వారి Pharia LLMపై ప్రారంభ పరీక్ష టోకనైజర్-ఆధారిత విధానాలతో పోలిస్తే శిక్షణ ఖర్చు మరియు కార్బన్ పాదముద్రలో 70 శాతం తగ్గింపును చూపించింది. ఈ వినూత్న విధానం ఫైన్-ట్యూనింగ్‌ను మరింత అందుబాటులోకి తెస్తుంది మరియు స్థిరంగా చేస్తుంది.

Aleph Alpha డాక్యుమెంట్ చేయబడిన జ్ఞానంలోని ఖాళీలను పరిష్కరించడానికి సాధనాలను కూడా అభివృద్ధి చేసింది, ఇవి సరికాని లేదా ఉపయోగపడని నిర్ధారణలకు దారితీస్తాయి.

ఉదాహరణకు, సమ్మతి ప్రశ్నకు సంబంధించిన రెండు ఒప్పందాలు ఒకదానికొకటి విరుద్ధంగా ఉంటే, “వ్యవస్థ మనిషిని సమీపించి, ‘నేను ఒక వ్యత్యాసాన్ని కనుగొన్నాను… ఇది వాస్తవ సంఘర్షణ కాదా అనే దానిపై దయచేసి ఫీడ్‌బ్యాక్ అందించగలరా?’” అని అడగవచ్చు అని ఆండ్రులిస్ వివరించారు.

Pharia Catch అని పిలువబడే ఈ ఫ్రేమ్‌వర్క్ ద్వారా సేకరించిన సమాచారం అప్లికేషన్ యొక్క నాలెడ్జ్ బేస్‌లోకి తిరిగి అందించబడుతుంది లేదా మరింత ప్రభావవంతమైన మోడల్‌లను ఫైన్-ట్యూన్ చేయడానికి ఉపయోగించబడుతుంది. ఈ ఫీడ్‌బ్యాక్ లూప్ కాలక్రమేణా AI సిస్టమ్ యొక్క ఖచ్చితత్వం మరియు విశ్వసనీయతను మెరుగుపరుస్తుంది.

ఆండ్రులిస్ ప్రకారం, ఈ సాధనాలు PwC, డెలాయిట్, కాప్‌జెమిని మరియు సుప్రా వంటి భాగస్వాములను ఆకర్షించాయి, వీరు Aleph Alpha యొక్క సాంకేతిక పరిజ్ఞానాన్ని అమలు చేయడానికి తుది కస్టమర్‌లతో కలిసి పని చేస్తారు. ఈ భాగస్వామ్యాలు నిజ-ప్రపంచ అనువర్తనాల్లో Aleph Alpha యొక్క పరిష్కారాల విలువ మరియు ఆచరణాత్మకతను ప్రదర్శిస్తాయి.

హార్డ్‌వేర్ అంశం

సాఫ్ట్‌వేర్ మరియు డేటా మాత్రమే సార్వభౌమ AI స్వీకర్తలను ఎదుర్కొంటున్న సవాళ్లు కాదు. హార్డ్‌వేర్ మరొక క్లిష్టమైన పరిశీలన.

వివిధ సంస్థలు మరియు దేశాలకు దేశీయంగా అభివృద్ధి చేసిన హార్డ్‌వేర్‌పై అమలు చేయడానికి నిర్దిష్ట అవసరాలు ఉండవచ్చు లేదా వర్క్‌లోడ్‌లు ఎక్కడ అమలు చేయవచ్చో నిర్దేశించవచ్చు. ఈ పరిమితులు హార్డ్‌వేర్ మరియు అవస్థాపన ఎంపికపై గణనీయంగా ప్రభావం చూపుతాయి.

దీని అర్థం ఆండ్రులిస్ మరియు అతని బృందం విస్తృత శ్రేణి హార్డ్‌వేర్ ఎంపికలకు మద్దతు ఇవ్వాలి. Aleph Alpha AMD, గ్రాఫ్‌కోర్ మరియు సెరెబ్రాస్‌తో సహా హార్డ్‌వేర్ భాగస్వాముల యొక్క పరిశీలనాత్మక సమూహాన్ని ఆకర్షించింది.

గత నెలలో, Aleph Alpha తన MI300-సిరీస్ యాక్సిలరేటర్‌లను ఉపయోగించడానికి AMDతో భాగస్వామ్యాన్ని ప్రకటించింది. ఈ సహకారం AI శిక్షణ మరియు అనుమితిని వేగవంతం చేయడానికి AMD యొక్క అధునాతన హార్డ్‌వేర్‌ను ప్రభావితం చేస్తుంది.

సాఫ్ట్‌బ్యాంక్ కొనుగోలు చేసిన గ్రాఫ్‌కోర్ మరియు జర్మన్ సాయుధ దళాల కోసం AI మోడల్‌లకు శిక్షణ ఇవ్వడానికి CS-3 వేఫర్-స్కేల్ యాక్సిలరేటర్‌లను ఉపయోగించే సెరెబ్రాస్‌తో సహకారాలను కూడా ఆండ్రులిస్ హైలైట్ చేశారు. ఈ భాగస్వామ్యాలు తమ కస్టమర్ల నిర్దిష్ట అవసరాలను తీర్చడానికి విభిన్న హార్డ్‌వేర్ ప్రొవైడర్లతో కలిసి పనిచేయడానికి Aleph Alpha యొక్క నిబద్ధతను ప్రదర్శిస్తాయి.

ఈ సహకారాలు ఉన్నప్పటికీ, Aleph Alpha యొక్క లక్ష్యం నిర్వహించబడే సేవ లేదా క్లౌడ్ ప్రొవైడర్‌గా మారడం కాదని ఆండ్రులిస్ నొక్కి చెప్పారు. “మేము ఎప్పటికీ క్లౌడ్ ప్రొవైడర్ కాము” అని ఆయన పేర్కొన్నారు. “నా కస్టమర్‌లు స్వేచ్ఛగా ఉండాలని మరియు లాక్ చేయబడకుండా ఉండాలని నేను కోరుకుంటున్నాను.” కస్టమర్ స్వేచ్ఛ మరియు సౌలభ్యం పట్ల ఈ నిబద్ధత Aleph Alphaను అనేక ఇతర AI కంపెనీల నుండి వేరు చేస్తుంది.

ముందున్న మార్గం: పెరుగుతున్న సంక్లిష్టత

ముందుకు చూస్తే, పరిశ్రమ చాట్‌బాట్‌ల నుండి మరింత అధునాతన సమస్య-పరిష్కార సామర్థ్యం గల ఏజెన్టిక్ AI సిస్టమ్‌లకు మారుతున్నందున AI అప్లికేషన్‌లను నిర్మించడం మరింత క్లిష్టంగా మారుతుందని ఆండ్రులిస్ ఊహించారు.

ఏజెన్టిక్ AI గత సంవత్సరంలో గణనీయమైన దృష్టిని ఆకర్షించింది, మోడల్ బిల్డర్‌లు, సాఫ్ట్‌వేర్ డెవలపర్‌లు మరియు హార్డ్‌వేర్ విక్రేతలు మల్టీ-స్టెప్ ప్రక్రియలను అకాలంలో పూర్తి చేయగల సిస్టమ్‌లను వాగ్దానం చేస్తున్నారు. ప్రారంభ ఉదాహరణలలో OpenAI యొక్క ఆపరేటర్ మరియు ఆంత్రోపిక్ యొక్క కంప్యూటర్ యూజ్ API ఉన్నాయి. ఈ ఏజెన్టిక్ AI సిస్టమ్‌లు AI సామర్థ్యాలలో గణనీయమైన పురోగతిని సూచిస్తాయి.

“గత సంవత్సరం, మేము ప్రధానంగా డాక్యుమెంట్ సారాంశం లేదా రచన సహాయం వంటి సూటిగా ఉండే పనులపై దృష్టి పెట్టాము” అని అతను చెప్పాడు. “ఇప్పుడు, మొదటి చూపులో genAI సమస్యలుగా కూడా కనిపించని విషయాలతో ఇది మరింత ఉత్తేజకరమైనదిగా మారుతోంది, ఇక్కడ వినియోగదారు అనుభవం చాట్‌బాట్ కాదు.” మరింత క్లిష్టమైన మరియు ఇంటిగ్రేటెడ్ AI అప్లికేషన్‌ల వైపు ఈ మార్పు పరిశ్రమకు కొత్త సవాళ్లు మరియు అవకాశాలను అందిస్తుంది.

ఎంటర్‌ప్రైజ్ AI అప్లికేషన్‌లను నిర్మించడంలో కీలక సవాళ్లు:

  • మోడల్ శిక్షణ మరియు అప్లికేషన్ ఇంటిగ్రేషన్ మధ్య అంతరాన్ని తగ్గించడం: LLMల సామర్థ్యాలను ఆచరణాత్మక అప్లికేషన్‌లలోకి సమర్థవంతంగా అనువదించడం గణనీయమైన అవరోధంగా మిగిలిపోయింది.
  • ఫైన్-ట్యూనింగ్ పరిమితులను అధిగమించడం: AI మోడల్‌లకు కొత్త సమాచారాన్ని బోధించడానికి లేదా వాటిని నిర్