గ్రానైట్ సిరీస్ను మెరుగుపరచడం: కేంద్రీకృత సామర్థ్యం, తగ్గించబడిన పాదముద్ర
IBM యొక్క గ్రానైట్ 3.2 నమూనాలు చిన్న నమూనాలను అభివృద్ధి చేయడానికి కంపెనీ వ్యూహం యొక్క కొనసాగింపును సూచిస్తాయి. ఈ నమూనాలు కంప్యూటింగ్ వనరులపై అధిక డిమాండ్లను విధించకుండా నిర్దిష్ట సామర్థ్యాలను అందించడానికి రూపొందించబడ్డాయి. ఈ విధానం AI పరిష్కారాలు శక్తివంతమైనవి మరియు తక్కువ ఖర్చుతో కూడుకున్నవి రెండూ అవసరమయ్యే అనేక వ్యాపారాల ఆచరణాత్మక అవసరాలకు అనుగుణంగా ఉంటుంది.
ఈ నమూనాలు హగ్గింగ్ ఫేస్లో Apache 2.0 లైసెన్స్ క్రింద బహిరంగంగా అందుబాటులో ఉన్నాయి. ఎంచుకున్న సంస్కరణలు IBM యొక్క స్వంత watsonx.ai ప్లాట్ఫారమ్, అలాగే Ollama, Replicate మరియు LM స్టూడియో ద్వారా కూడా అందుబాటులో ఉన్నాయి. ఈ విస్తృత ప్రాప్యత రాబోయే నెలల్లో Red Hat Enterprise Linux AI 1.5లో ఈ నమూనాలను సమగ్రపరిచే ప్రణాళికల ద్వారా మరింత మెరుగుపరచబడింది, ఇది ఓపెన్ సోర్స్ AIకి IBM యొక్క నిబద్ధతను బలపరుస్తుంది.
పత్రాల ప్రాసెసింగ్లో విప్లవాత్మక మార్పులు: గ్రానైట్ విజన్ మోడల్
ఈ విడుదలలో ఒక విశిష్ట లక్షణం ఏమిటంటే, పత్రాలను అర్థం చేసుకునే పనుల కోసం ప్రత్యేకంగా ఇంజనీరింగ్ చేయబడిన ఒక నవల విజన్ లాంగ్వేజ్ మోడల్. పత్రాల నుండి సమాచారాన్ని ఎలా పరస్పరం చర్య చేయవచ్చో మరియు సంగ్రహించవచ్చో ఈ నమూనా గణనీయమైన పురోగతిని సూచిస్తుంది. IBM యొక్క అంతర్గత బెంచ్మార్క్ పరీక్షల ప్రకారం, ఈ కొత్త మోడల్ ఎంటర్ప్రైజ్-స్థాయి వర్క్లోడ్లను ప్రతిబింబించేలా ప్రత్యేకంగా రూపొందించిన పరీక్షలలో చాలా పెద్ద పోటీదారు మోడల్లతో సమానంగా లేదా అధిగమిస్తుంది.
ఈ సామర్థ్యం యొక్క అభివృద్ధిలో IBM యొక్క ఓపెన్ సోర్స్ డాక్లింగ్ టూల్కిట్ను ఉపయోగించడం జరిగింది. ఈ టూల్కిట్ 85 మిలియన్ PDF పత్రాలను ప్రాసెస్ చేయడానికి ఉపయోగించబడింది, 26 మిలియన్ సింథటిక్ ప్రశ్న-జవాబు జతలను ఉత్పత్తి చేస్తుంది. ఈ విస్తృతమైన తయారీ, ఫైనాన్స్, హెల్త్కేర్ మరియు లీగల్ సర్వీసెస్తో సహా అనేక ఎంటర్ప్రైజ్ పరిసరాలకు సంబంధించిన పత్ర-ఇంటెన్సివ్ వర్క్ఫ్లోలను నిర్వహించడానికి మోడల్ బాగా సన్నద్ధమైందని నిర్ధారిస్తుంది.
కీలక గణాంకాలు స్కేల్ మరియు సామర్థ్యాన్ని హైలైట్ చేస్తాయి:
- 85 మిలియన్: కొత్త విజన్ మోడల్కు శిక్షణ ఇవ్వడానికి IBM యొక్క డాక్లింగ్ టూల్కిట్ని ఉపయోగించి ప్రాసెస్ చేయబడిన PDF పత్రాల సంఖ్య. ఈ భారీ డేటాసెట్ వాస్తవ-ప్రపంచ పత్ర ప్రాసెసింగ్ సవాళ్లకు మోడల్ యొక్క సంసిద్ధతను నొక్కి చెబుతుంది.
- 30%: పనితీరు స్థాయిలను కొనసాగిస్తూ గ్రానైట్ గార్డియన్ భద్రతా నమూనాలలో సాధించిన పరిమాణ తగ్గింపు. ఇది భద్రతను త్యాగం చేయకుండా సామర్థ్యాన్ని ఆప్టిమైజ్ చేయడానికి IBM యొక్క నిబద్ధతను ప్రదర్శిస్తుంది.
- 2 సంవత్సరాలు: 10 మిలియన్ కంటే తక్కువ పారామితులను కలిగి ఉన్నప్పటికీ, IBM యొక్క TinyTimeMixers మోడల్ల గరిష్ట సూచన పరిధి. ఇది దీర్ఘకాలిక అంచనాల కోసం ఈ ప్రత్యేక నమూనాల యొక్క విశేష సామర్థ్యాన్ని ప్రదర్శిస్తుంది.
మెరుగైన రీజనింగ్: చైన్ ఆఫ్ థాట్ మరియు ఇన్ఫెరెన్స్ స్కేలింగ్
IBM గ్రానైట్ 3.2 యొక్క 2B మరియు 8B పారామీటర్ వెర్షన్లలో “చైన్ ఆఫ్ థాట్” రీజనింగ్ను కూడా చేర్చింది. ఈ ఫీచర్ మోడల్లను నిర్మాణాత్మక, క్రమబద్ధమైన పద్ధతిలో సమస్యలను చేరుకోవడానికి అనుమతిస్తుంది, వాటిని మానవ తార్కిక ప్రక్రియలను ప్రతిబింబించే దశలుగా విభజిస్తుంది. ఇది తార్కిక తగ్గింపు అవసరమయ్యే సంక్లిష్ట పనులను పరిష్కరించే నమూనాల సామర్థ్యాన్ని పెంచుతుంది.
ముఖ్యంగా, వినియోగదారులు పని యొక్క సంక్లిష్టతను బట్టి ఈ సామర్థ్యాన్ని సక్రియం చేయడానికి లేదా నిష్క్రియం చేయడానికి వశ్యతను కలిగి ఉంటారు. ఈ అనుకూలత అనేది ఒక ముఖ్యమైన వ్యత్యాసం, సంస్థలు వారి నిర్దిష్ట అవసరాల ఆధారంగా వనరుల వినియోగాన్ని ఆప్టిమైజ్ చేయడానికి అనుమతిస్తుంది. సరళమైన పనుల కోసం, కంప్యూటింగ్ శక్తిని సంరక్షించడానికి చైన్ ఆఫ్ థాట్ రీజనింగ్ను నిలిపివేయవచ్చు, మరింత సంక్లిష్ట సమస్యల కోసం, మోడల్ యొక్క పూర్తి తార్కిక సామర్థ్యాన్ని పెంచడానికి దీన్ని ప్రారంభించవచ్చు.
ఈ మెరుగుదలలు ఇన్స్ట్రక్షన్-ఫాలోయింగ్ బెంచ్మార్క్లలో 8B మోడల్ పనితీరులో గణనీయమైన మెరుగుదలలకు దారితీశాయి, మునుపటి సంస్కరణలను అధిగమించాయి. వినూత్నమైన “ఇన్ఫెరెన్స్ స్కేలింగ్” పద్ధతుల ద్వారా, గణిత తార్కిక బెంచ్మార్క్లపై చాలా పెద్ద సిస్టమ్లతో కూడా ఈ సాపేక్షంగా చిన్న మోడల్ సమర్థవంతంగా పోటీపడుతుందని IBM నిరూపించింది. ఇది నిర్దిష్ట డొమైన్లలో ఆకట్టుకునే పనితీరును అందించడానికి చిన్న, ఆప్టిమైజ్ చేయబడిన మోడల్ల సామర్థ్యాన్ని హైలైట్ చేస్తుంది.
భద్రత మరియు సూక్ష్మభేదం: గ్రానైట్ గార్డియన్ నవీకరణలు
AI-ఉత్పత్తి కంటెంట్తో అనుబంధించబడిన సంభావ్య ప్రమాదాలను పర్యవేక్షించడానికి మరియు తగ్గించడానికి రూపొందించబడిన గ్రానైట్ గార్డియన్ భద్రతా నమూనాలు కూడా గణనీయమైన నవీకరణలకు గురయ్యాయి. ఈ నమూనాలు వాటి పనితీరు స్థాయిలను కొనసాగిస్తూ 30% పరిమాణంలో తగ్గించబడ్డాయి. ఈ ఆప్టిమైజేషన్ ఎక్కువ సామర్థ్యానికి మరియు తగ్గిన వనరుల వినియోగానికి దోహదం చేస్తుంది.
ఇంకా, ఈ నమూనాలు ఇప్పుడు “వెర్బలైజ్డ్ కాన్ఫిడెన్స్” అనే ఫీచర్ను కలిగి ఉన్నాయి. ఈ ఫీచర్ భద్రతా పర్యవేక్షణలో అనిశ్చితి స్థాయిలను గుర్తించడం ద్వారా మరింత సూక్ష్మమైన ప్రమాద అంచనాను అందిస్తుంది. సురక్షితమైన/అసురక్షిత వర్గీకరణను అందించడానికి బదులుగా, నమూనాలు వాటి అంచనాలలో విభిన్న స్థాయిల విశ్వాసాన్ని వ్యక్తీకరించగలవు, వినియోగదారులకు మరింత సమాచార మరియు పారదర్శక మూల్యాంకనాన్ని అందిస్తాయి.
TinyTimeMixers: వ్యూహాత్మక ప్రణాళిక కోసం దీర్ఘ-శ్రేణి సూచన
గ్రానైట్ నవీకరణలతో పాటు, IBM తన TinyTimeMixers మోడళ్ల తదుపరి తరాన్ని కూడా విడుదల చేసింది. ఈ నమూనాలు చాలా చిన్నవి, పరిశ్రమలోని అనేక ఇతర నమూనాల పరిమాణంలో కొంత భాగాన్ని కలిగి ఉంటాయి - 10 మిలియన్ కంటే తక్కువ పారామితులు. వాటి కాంపాక్ట్ పరిమాణం ఉన్నప్పటికీ, ఈ ప్రత్యేక నమూనాలు రెండు సంవత్సరాల వరకు టైమ్ సిరీస్ డేటాను అంచనా వేయగల సామర్థ్యాన్ని కలిగి ఉంటాయి.
ఈ సామర్థ్యం ముఖ్యంగా వ్యాపార అనువర్తనాల శ్రేణికి విలువైనది, వీటిలో:
- ఆర్థిక ధోరణి విశ్లేషణ: మార్కెట్ కదలికలను అంచనా వేయడం మరియు పెట్టుబడి అవకాశాలను గుర్తించడం.
- సరఫరా గొలుసు ప్రణాళిక: జాబితా స్థాయిలను ఆప్టిమైజ్ చేయడం మరియు డిమాండ్ హెచ్చుతగ్గులను ఊహించడం.
- రిటైల్ ఇన్వెంటరీ నిర్వహణ: వ్యర్థాలను తగ్గించేటప్పుడు కస్టమర్ డిమాండ్ను తీర్చడానికి తగినంత స్టాక్ స్థాయిలను నిర్ధారించడం.
ఈ అనువర్తనాలన్నీ దీర్ఘకాలిక అంచనాల ఆధారంగా సమాచార నిర్ణయాలు తీసుకునే సామర్థ్యంపై ఆధారపడి ఉంటాయి, TinyTimeMixers మోడల్లను వ్యూహాత్మక వ్యాపార ప్రణాళిక కోసం శక్తివంతమైన సాధనంగా మారుస్తాయి.
వాస్తవ-ప్రపంచ వ్యాపార పరిమితులను పరిష్కరించడం
గ్రానైట్ మోడళ్లలోని తార్కిక సామర్థ్యాలను టోగుల్ చేయగల సామర్థ్యం AI అమలులో ఆచరణాత్మక సవాలును నేరుగా పరిష్కరిస్తుంది. స్టెప్-బై-స్టెప్ రీజనింగ్ విధానాలు, శక్తివంతమైనవి అయినప్పటికీ, గణనీయమైన కంప్యూటింగ్ శక్తి అవసరం, అది ఎల్లప్పుడూ అవసరం లేదు. ఈ ఫీచర్ను ఐచ్ఛికంగా చేయడం ద్వారా, IBM సంస్థలు మరింత సంక్లిష్ట సమస్యల కోసం అధునాతన తార్కికం యొక్క ఎంపికను నిలుపుకుంటూ సరళమైన పనుల కోసం కంప్యూటింగ్ ఖర్చులను తగ్గించడానికి వీలు కల్పిస్తుంది.
ఈ విధానం వాస్తవ-ప్రపంచ వ్యాపార పరిమితుల గురించి లోతైన అవగాహనను ప్రతిబింబిస్తుంది, ఇక్కడ సామర్థ్యం మరియు తక్కువ ఖర్చు-ప్రభావం తరచుగా ముడి పనితీరు వలె ముఖ్యమైనవి. నిర్దిష్ట వ్యాపార అవసరాలకు అనుగుణంగా ఉండే ఆచరణాత్మక పరిష్కారాలను అందించడంపై IBM దృష్టి పెట్టడం అనేది రద్దీగా ఉండే AI మార్కెట్లో ఒక ముఖ్యమైన వ్యత్యాసం.
ట్రాక్షన్ను పొందడం: ఆచరణాత్మక ప్రభావానికి సాక్ష్యం
చిన్న, ప్రత్యేకమైన మోడల్లను అభివృద్ధి చేసే IBM యొక్క వ్యూహం మార్కెట్తో ప్రతిధ్వనిస్తున్నట్లు కనిపిస్తోంది. మునుపటి గ్రానైట్ 3.1 8B మోడల్ ఇటీవల కస్టమర్ రిలేషన్షిప్ మేనేజ్మెంట్ (CRM) కోసం Salesforce LLM బెంచ్మార్క్లో బలమైన పనితీరును సాధించింది. ఈ బెంచ్మార్క్ CRMకి సంబంధించిన పనులు, కస్టమర్ ఇంటరాక్షన్ అనాలిసిస్ మరియు వ్యక్తిగతీకరించిన కంటెంట్ జనరేషన్ వంటి వాటిపై LLMల పనితీరును విశ్లేషించడానికి ప్రత్యేకంగా రూపొందించబడింది.
ఈ బెంచ్మార్క్లో గ్రానైట్ 3.1 8B మోడల్ యొక్క బలమైన పనితీరు చిన్న, ప్రత్యేకమైన మోడల్లు నిర్దిష్ట వ్యాపార అవసరాలను సమర్థవంతంగా తీర్చగలవని సూచిస్తుంది. IBM యొక్క విధానం సైద్ధాంతికంగా మాత్రమే కాకుండా ఆచరణాత్మకంగా కూడా ఆచరణీయమైనదని ఇది మరింత సాక్ష్యాలను అందిస్తుంది.
సామర్థ్యం, ఏకీకరణ మరియు వాస్తవ-ప్రపంచ ప్రభావంపై దృష్టి
IBM AI రీసెర్చ్ వైస్ ప్రెసిడెంట్ శ్రీరామ్ రాఘవన్, కంపెనీ తత్వాన్ని క్లుప్తంగా సంగ్రహించారు: “AI యొక్క తదుపరి శకం సామర్థ్యం, ఏకీకరణ మరియు వాస్తవ-ప్రపంచ ప్రభావం గురించి - ఇక్కడ సంస్థలు కంప్యూటర్పై అధిక వ్యయం లేకుండా శక్తివంతమైన ఫలితాలను సాధించగలవు. IBM యొక్క తాజా గ్రానైట్ అభివృద్ధి ఓపెన్ సొల్యూషన్లపై దృష్టి సారించడం AIని మరింత అందుబాటులోకి, తక్కువ ఖర్చుతో మరియు ఆధునిక సంస్థలకు విలువైనదిగా మార్చడంలో మరో ముందడుగును ప్రదర్శిస్తుంది.”
ఈ ప్రకటన సాంకేతికంగా అభివృద్ధి చెందినది మాత్రమే కాకుండా ఆచరణాత్మకమైన, అందుబాటులో ఉండే మరియు వ్యాపారాల వాస్తవ-ప్రపంచ అవసరాలకు అనుగుణంగా ఉండే AI పరిష్కారాలను అభివృద్ధి చేయడానికి IBM యొక్క నిబద్ధతను సంగ్రహిస్తుంది. ఓపెన్ సొల్యూషన్లపై దృష్టి పెట్టడం AI కమ్యూనిటీలో సహకారం మరియు ఆవిష్కరణలను ప్రోత్సహించడానికి IBM యొక్క అంకితభావాన్ని మరింత నొక్కి చెబుతుంది. కేవలం అతిపెద్ద మోడల్లను నిర్మించడం నుండి స్పష్టమైన విలువను అందించే మరియు వ్యాపారాలు వారి వ్యూహాత్మక లక్ష్యాలను సాధించడానికి అధికారం ఇచ్చే AI సాధనాలను సృష్టించడం వైపు దృష్టి మారుతోంది.