మానవుల వంటి స్వరాల కోసం AI అన్వేషణ

మనిషి పరస్పర చర్యలను అనుకరించగల కృత్రిమ మేధస్సు యొక్క అన్వేషణ కొన్ని ఆకర్షణీయమైన మరియు కొన్నిసార్లు కలవరపరిచే పరిణామాలకు దారితీసింది. తెలివైనది మాత్రమే కాకుండా సంబంధితంగా కూడా ఉండే AI అసిస్టెంట్‌లను సృష్టించే ప్రయత్నంలో, కంపెనీలు తమ వాయిస్ మోడల్‌లకు శిక్షణ ఇవ్వడానికి వివిధ పద్ధతులను ఉపయోగిస్తున్నాయి. ఇటీవల వెల్లడించిన విషయాలు ఒక ప్రయత్నంపై వెలుగునిచ్చాయి: xAI యొక్క "ప్రాజెక్ట్ జైలోఫోన్."

ప్రాజెక్ట్ జైలోఫోన్ లోపల: సంభాషణాత్మక AIని రూపొందించడం

లీక్ అయిన పత్రాలు ప్రాజెక్ట్ జైలోఫోన్ యొక్క అంతర్గత కార్యకలాపాలను బహిర్గతం చేశాయి, ఇది xAI యొక్క వాయిస్ మోడల్‌లను మెరుగుపరచడానికి రూపొందించబడిన స్కేల్ AI చొరవ. ఈ ప్రాజెక్ట్ విభిన్న విషయాలపై సంభాషణలను మెరుగుపరచడానికి కాంట్రాక్టర్లను నిమగ్నం చేయడం చుట్టూ తిరుగుతుంది. xAI యొక్క నమూనాలను మరింత సహజమైన, మానవులవంటి నాణ్యతతో నింపడం దీని ప్రధాన లక్ష్యం, తరచుగా AI పరస్పర చర్యలను వర్గీకరించే రోబోటిక్ స్వరం నుండి దూరంగా ఉంటుంది.

డేటా-లేబులింగ్ కంపెనీ స్కేల్ AI ద్వారా అందించబడిన ఈ కాంట్రాక్టర్లు, xAI యొక్క వాయిస్ మోడల్‌లు మరింత ప్రామాణికంగా వినిపించేలా చేయడానికి, సాధారణమైనవి నుండి ఊహాజనితమైనవి వరకు అనేక అంశాలపై వారి సహచరులతో సంభాషణలను రికార్డ్ చేసినందుకు పరిహారం పొందుతారు. ఏప్రిల్ నాటికి, స్కేల్ AI xAI కోసం కనీసం 10 జనరేటివ్ AI ప్రాజెక్ట్‌లను నిర్వహిస్తోంది, ఇది ఈ ప్రాంతంలోకి కురిపిస్తున్న తీవ్రమైన ప్రయత్నాన్ని ప్రతిబింబిస్తుంది.

మరింత సంభాషణాత్మక AI కోసం పరిశ్రమ-వ్యాప్త ప్రోత్సాహం ఈ సేవల యొక్క ప్రీమియం, చెల్లింపు సంస్కరణలకు వినియోగదారులను ఆకర్షించాలనే కోరిక నుండి వచ్చింది. AI పరస్పర చర్యలను మరింత ఆనందదాయకంగా మరియు సహజంగా చేయడం ద్వారా, కంపెనీలు ఈ అధునాతన సాంకేతికతలలో పెట్టుబడి పెట్టడానికి వినియోగదారులను ఆకర్షించాలని ఆశిస్తున్నాయి.

సంభాషణ శిక్షణ కోసం బ్లూప్రింట్

బిజినెస్ ఇన్‌సైడర్ స్కేల్ AI పత్రాల శ్రేణిని పొందింది, ఇది ప్రాజెక్ట్ జైలోఫోన్ ఎలా పనిచేస్తుందో వివరంగా అందిస్తుంది. ప్రాజెక్ట్ సూచనలు, సమీక్షకుల మార్గదర్శకాలు మరియు సంభాషణ అంశ మార్గదర్శకాలతో సహా ఈ పత్రాలు ప్రాజెక్ట్ యొక్క పద్ధతికి సమగ్ర అవలోకనాన్ని అందిస్తాయి.

శిక్షణ పొందుతున్న నిర్దిష్ట xAI మోడల్ పత్రాలలో వెల్లడి చేయనప్పటికీ, "ఆడియో నాణ్యత మరియు సహజమైన ధారాళత"పై ప్రాజెక్ట్ యొక్క దృష్టి అతుకులు లేని మరియు ఆకర్షణీయమైన వినియోగదారు అనుభవాన్ని సృష్టించడంపై బలమైన ప్రాధాన్యతని సూచిస్తుంది. కావలసిన స్థాయి వాస్తవికతను సాధించడంలో స్వర పనితీరు యొక్క ప్రాముఖ్యతను ప్రతిబింబిస్తూ, వాయిస్ నటన అనుభవం ఉన్న కాంట్రాక్టర్లు పాల్గొనడానికి ప్రత్యేకంగా ప్రోత్సహించబడ్డారు.

ప్రాజెక్ట్ జైలోఫోన్ రెండు ప్రాథమిక భాగాల చుట్టూ రూపొందించబడింది: "సంభాషణలు" మరియు "గ్రాస్‌ల్యాండ్స్." "సంభాషణలు" భాగంలో ముగ్గురు కాంట్రాక్టర్ల బృందాలు జూమ్ ద్వారా వాస్తవిక సంభాషణలలో పాల్గొంటాయి. ఈ సంభాషణలు వందలాది ప్రాంప్ట్‌లను కలిగి ఉన్న స్ప్రెడ్‌షీట్ ద్వారా మార్గనిర్దేశం చేయబడతాయి, ఇవి పోస్ట్-అపోకలిప్టిక్ ప్రపంచంలో మనుగడ వ్యూహాల నుండి ఆందోళనను నిర్వహించడం మరియు అంతర్జాతీయ పర్యటనలను ప్లాన్ చేయడం వరకు అనేక రకాల అంశాలను కవర్ చేస్తాయి.

సంభాషణ ప్రాంప్ట్‌లలోకి లోతుగా డైవింగ్: AI యొక్క ఊహలోకి ఒక సంగ్రహావలోకనం

ప్రాజెక్ట్ జైలోఫోన్‌లో ఉపయోగించిన సంభాషణ ప్రాంప్ట్‌లు AI మోడల్‌లు నిర్వహించడానికి శిక్షణ పొందుతున్న దృశ్యాలు మరియు అంశాల గురించి ఆసక్తికరమైన సంగ్రహావలోకనాన్ని అందిస్తాయి. ప్రాంప్ట్‌లు ఆచరణాత్మకమైనవి నుండి తాత్వికమైనవి వరకు ఉంటాయి మరియు సైన్స్ ఫిక్షన్ రంగాన్ని కూడా పరిశీలిస్తాయి.

స్కేల్ AI పత్రాలలో ఉపయోగించిన సంభాషణ స్టార్టర్‌లకు కొన్ని ఉదాహరణలు ఇక్కడ ఉన్నాయి:

  • మీరు మొదటి మార్స్ సెటిల్‌మెంట్ కోసం ‘సంస్కృతి’ని రూపొందిస్తుంటే, మీరు ఖచ్చితంగా తిరిగి సృష్టించాలనుకునే భూమి సంప్రదాయం ఏమిటి మరియు మీరు శాశ్వతంగా వదిలించుకోవడానికి ఏమి సంతోషిస్తారు?
  • మీ దైనందిన జీవితంలో ‘విలన్’ ఏమిటి, దానిని పరిష్కరించడానికి ఒక సూపర్‌హీరో బృందం దూసుకుపోవాలని మరియు ప్రతి ఒక్కరికీ పరిష్కరించాలని మీరు కోరుకుంటారు?
  • రేపు జాంబీ అపోకలిప్స్ సంభవిస్తే, మీరు ఇంట్లో నుండి పారిపోయే ముందు మీరు మొదట ఏమి తీసుకుంటారు?
  • మీరు మార్స్ కాలనీకి మిషన్ సైకాలజిస్ట్‌గా ఉన్నారని ఊహించుకోండి—మీ తోటి కాలనీవాసులలో మీరు వ్యక్తిత్వ రకం లేదా విచిత్రమైన లక్షణాన్ని రహస్యంగా కనుగొనాలని ఆశిస్తారు?
  • గృహయజమానిగా మీరు అనుభవించిన అత్యంత గుర్తుండిపోయే ప్లంబింగ్ విపత్తు ఏమిటి మరియు మీరు స్వయంగా పరిష్కరించడానికి ప్రయత్నించారా లేదా వెంటనే సహాయం కోసం పిలిచారా?
  • మీరు మొదటిసారి ఎక్కువ డబ్బు లేదా మెరుగైన ప్రయోజనాల కోసం అడగవలసి వచ్చినప్పుడు మీకు గుర్తుందా? మీ మనస్సులో ఏమి జరుగుతోంది?

ఈ ప్రాంప్ట్‌లు కాంట్రాక్టర్ల నుండి సహజమైన, లిఖితపూర్వక ప్రతిస్పందనలను వెలికితీయడానికి రూపొందించబడ్డాయి, వీటిని AI మోడల్‌లకు విస్తృతమైన సంభాషణ దృశ్యాలను నిర్వహించడానికి శిక్షణ ఇవ్వడానికి ఉపయోగించవచ్చు.

సహజంగా మరియు భావోద్వేగంగా, విభిన్న శబ్దాలు మరియు అంతరాయాలతో ఉండటం యొక్క ప్రాముఖ్యతను "మంచి" సంభాషణల కోసం సూచనలు నొక్కిచెబుతున్నాయి. వాస్తవ ప్రపంచ మానవ సంభాషణ యొక్క ఆకస్మికత మరియు ఊహించలేనితనాన్ని అనుకరించడం లక్ష్యం.

గ్రాస్‌ల్యాండ్స్ విధానం: లిఖితపూర్వం లేనిది మరియు ప్రామాణికమైనది

నిర్మాణాత్మకమైన "సంభాషణలు" భాగానికి విరుద్ధంగా, "గ్రాస్‌ల్యాండ్స్" భాగం సొంతంగా పనిచేసే కార్మికులు వారి స్థానిక భాషలలో లిఖితపూర్వం లేని, సహజంగా వినిపించే రికార్డింగ్‌లను సృష్టించడంపై దృష్టి పెడుతుంది. ఈ కార్మికులకు సంభాషణ రకం మరియు ఉపవర్గం ఇవ్వబడుతుంది మరియు నేపథ్య శబ్దం కూడా ప్రోత్సహించబడుతూ సంభాషణను స్వేచ్ఛగా ప్రవహించమని ప్రోత్సహించబడతారు.

"గ్రాస్‌ల్యాండ్స్" భాగం "సాక్రటిక్ ప్రశ్నించడం, ""ప్రతిబింబ కథ చెప్పడం, ""కోర్ట్లీ ప్రేమ దృశ్యాలు, ""హీరో-విలన్ ఘర్షణలు, "మరియు "సహకార పజిల్ పరిష్కారం"తో సహా డజన్ల కొద్దీ ఉపవర్గాలను కలిగి ఉంటుంది. ఈ ఉపవర్గాలు తరచుగా విభిన్న ఉచ్చారణలు, ధ్వని ప్రభావాలు లేదా కనుగొనబడిన భాషా నమూనాలు వంటి నిర్దిష్ట అవసరాలను కలిగి ఉంటాయి.

"గ్రాస్‌ల్యాండ్స్" విధానం మరింత ప్రామాణికమైన మరియు అనియంత్రిత పద్ధతిలో మానవ సంభాషణ యొక్క సూక్ష్మ నైపుణ్యాలు మరియు సంక్లిష్టతలను సంగ్రహించాలనే కోరికను ప్రతిబింబిస్తుంది.

AI శిక్షణ యొక్క ఆర్థిక శాస్త్రం: పరిహారం యొక్క సంగ్రహావలోకనం

ప్రాజెక్ట్ జైలోఫోన్‌లో పాల్గొన్న స్కేల్ AI కాంట్రాక్టర్లు వారి సహకారానికి పరిహారం పొందుతారు, ఇది AI శిక్షణ యొక్క ఆర్థిక అంశాన్ని హైలైట్ చేస్తుంది. నివేదికల ప్రకారం, కాంట్రాక్టర్లకు వారి పనికి ఒక్కో టాస్క్‌కు కొన్ని డాలర్లు చెల్లించబడతాయి.

"గ్రాస్‌ల్యాండ్స్" ప్రాజెక్ట్ కోసం చెల్లింపు నిర్మాణం ఒక్కో టాస్క్‌కు $3 వద్ద ప్రారంభమైందని, కానీ తరువాత ఒక్కో టాస్క్‌కు $1కి తగ్గించబడిందని నివేదికలు చెబుతున్నాయి. ప్రతి పనిలో ఆడియో ఫైల్‌ను రికార్డ్ చేయడం ఉంటుంది, దానిని కాంట్రాక్టర్లు స్కేల్ AI ప్లాట్‌ఫారమ్‌కు అప్‌లోడ్ చేస్తారు మరియు మానవీయంగా ట్రాన్స్‌క్రైబ్ చేస్తారు.

తక్కువ రేట్ల చెల్లింపులు AI మోడల్‌లను సృష్టించడం మరియు శిక్షణ ఇవ్వడంలోకి వెళ్లే తరచుగా కనిపించని శ్రమను నొక్కి చెబుతున్నాయి.

డేటా నాణ్యత యొక్క ప్రాముఖ్యత: మానవ ప్రసంగం యొక్క సూక్ష్మ నైపుణ్యాలను సంగ్రహించడం

AI వాయిస్ మోడల్‌ల విజయం విస్తారమైన మొత్తంలో అధిక-నాణ్యత డేటా లభ్యతపై ఆధారపడి ఉంటుంది. ప్రాజెక్ట్ జైలోఫోన్ వ్యక్తుల మధ్య సహజంగా వినిపించే సంభాషణల వంటి వాస్తవ ప్రపంచ దృశ్యాలను పునఃసృష్టించడం ద్వారా తగిన డేటాను రూపొందించే ప్రయత్నాన్ని ప్రతిబింబిస్తుంది.

"గ్రాస్‌ల్యాండ్స్" పత్రం కాంట్రాక్టర్లను వారి ట్రాన్స్‌క్రిప్షన్‌లలో "ఉహ్" వంటి పూరక పదాలను చేర్చమని స్పష్టంగా సూచిస్తుంది. ఈ శ్రద్ధ మానవ ప్రసంగం యొక్క సూక్ష్మ నైపుణ్యాలను, విరామాలు, సంకోచాలు మరియు ఇతర మౌఖిక సంకేతాలతో సహా సంగ్రహించడం యొక్క ప్రాముఖ్యతను నొక్కి చెబుతుంది.

ఈ అంశాలను శిక్షణా డేటాలో చేర్చడం ద్వారా, AI నమూనాలు మరింత సహజమైన మరియు ఆకర్షణీయమైన సంభాషణలను ఉత్పత్తి చేయడానికి నేర్చుకోగలవు.

AIలోకి వ్యక్తిత్వాన్ని ఇంజెక్ట్ చేయడం: పోటీతత్వ ప్రయోజనం

ప్రాజెక్ట్ జైలోఫోన్ AI కంపెనీలలోని విస్తృత ధోరణిలో భాగం, వారి AI మోడల్‌లలో వ్యక్తిత్వాన్ని ఇంజెక్ట్ చేయడానికి, పెరుగుతున్న రద్దీ మార్కెట్‌లో తమను తాము వేరు చేయడానికి ప్రయత్నిస్తుంది.

ఉదాహరణకు, మెటా తన AIకి శిక్షణ ఇస్తున్న గిగ్ వర్కర్లను "వివేకం మరియు ఆధ్యాత్మిక విజార్డ్" లేదా "హైపర్-ఎక్సైటెడ్ మ్యూజిక్ థియరీ విద్యార్థి" వంటి విభిన్న వ్యక్తులను స్వీకరించమని అడుగుతూ స్కేల్ AI ద్వారా ఒక ప్రాజెక్ట్‌ను నిర్వహించినట్లు నివేదికలు చెబుతున్నాయి.

OpenAI యొక్క సామ్ ఆల్ట్‌మాన్ తాజా GPT-4o "చాలా సికోఫాంట్-వై మరియు బాధించేది"గా మారిందని అంగీకరించారు, ఇది దాని ప్రత్యుత్తరాలను మరింత సహజంగా చేయడానికి రీసెట్‌కు దారితీసింది.

AI నమూనాలు తెలివైనవిగా ఉండటమే కాకుండా - అవి ఇష్టపడేవిగా మరియు సంబంధితంగా కూడా ఉండాలని ఈ ప్రయత్నాలు గుర్తింపును ప్రతిబింబిస్తాయి.

AI శిక్షణ యొక్క నైతిక కోణాలు: పక్షపాతంతో ఖచ్చితత్వాన్ని సమతుల్యం చేయడం

AI నమూనాలు మరింత అధునాతనంగా మారడంతో, పక్షపాతం మరియు నైతిక పరిశీలనల గురించి ఆందోళనలు పెరిగాయి, బాధ్యతాయుతమైన AI అభివృద్ధి గురించి చర్చలకు ఆజ్యం పోస్తున్నాయి.

xAI గ్రోక్‌ను ముస్క్ "మేల్కొలుపు" ప్రత్యర్థులని పిలిచే దానికంటే రాజకీయంగా మరింత సమస్యాత్మకమైన చాట్‌బాట్‌గా విక్రయించింది, శిక్షణ పద్ధతులు కొన్నిసార్లు కుడి-వింగ్ లేదా విరుద్ధమైన అభిప్రాయాలపై ఎక్కువగా ఆధారపడతాయి.

Grok యొక్క ఊహించలేని వైపును నియంత్రించడానికి xAI తన ప్రయత్నాలను కూడా పెంచింది. కొత్త నియామకాలు Grokని "రెడ్ టీమింగ్" చేస్తున్నాయి, ముఖ్యంగా వివాదాస్పద విషయాలపై మరియు "NSFW" లేదా "అదుపు లేని" మోడ్‌లలో అసురక్షితమైన లేదా విధానాన్ని ఉల్లంఘించే ప్రత్యుత్తరాల కోసం ఒత్తిడి-పరీక్షలు చేస్తున్నాయి.

ఈ ప్రయత్నాలు సమాచారంగా మరియు నైతికంగా ఉండే AI మోడల్‌లను సృష్టించే సవాళ్లను మరియు కొనసాగుతున్న పర్యవేక్షణ మరియు మూల్యాంకన అవసరాన్ని హైలైట్ చేస్తాయి.

AI వాయిస్ మోడల్‌ల యొక్క కొనసాగుతున్న పరిణామం: అతుకులు లేని పరస్పర చర్య యొక్క భవిష్యత్తు

ప్రాజెక్ట్ జైలోఫోన్ మరియు ఇలాంటి కార్యక్రమాలు మానవులతో సజావుగా సంభాషించగల AI వాయిస్ మోడల్‌లను రూపొందించే ప్రయత్నానికి ఒక ముఖ్యమైన ముందడుగును సూచిస్తాయి. AI సాంకేతికత అభివృద్ధి చెందుతూనే ఉన్నందున, భవిష్యత్తులో మరింత అధునాతనమైన మరియు సహజంగా వినిపించే AI అసిస్టెంట్‌లను మనం చూడవచ్చు.

మానవుల వంటి AI వాయిస్ మోడల్‌ల కోసం అన్వేషణ దాని సవాళ్లను లేకుండా లేదు. పక్షపాతం, నైతిక పరిశీలనలు మరియు దుర్వినియోగం కోసం సంభావ్యత గురించి ఆందోళనలు మిగిలి ఉన్నాయి. అయితే, ఈ సాంకేతికతల యొక్క సంభావ్య ప్రయోజనాలు అపారమైనవి, అందుబాటును మెరుగుపరచడం నుండి కమ్యూనికేషన్ మరియు సహకారాన్ని మెరుగుపరచడం వరకు.

AI వాయిస్ మోడల్‌లు మరింత ప్రబలంగా మారడంతో, ఈ సవాళ్లను ముందుగానే పరిష్కరించడం మరియు ఈ సాంకేతికతలు బాధ్యతాయుతంగా మరియు నైతికంగా ఉపయోగించబడుతున్నాయని నిర్ధారించడం ముఖ్యం. AI వాయిస్ మోడల్‌ల భవిష్యత్తు గొప్ప వాగ్దానాన్ని కలిగి ఉంది, కానీ ఆ భవిష్యత్తును మానవాళి మొత్తానికి ప్రయోజనం చేకూర్చే విధంగా రూపొందించడం మనపై ఆధారపడి ఉంటుంది.

మరింత మానవుల మాదిరిగా ధ్వనించే AIని సృష్టించే ప్రయత్నం కష్టమైనది, లీక్ అయిన పత్రాలలో స్పష్టంగా కనిపిస్తుంది. AI సరైన వ్యాకరణంతో స్పష్టంగా మాట్లాడటమే కాకుండా, దానితో మాట్లాడే వ్యక్తికి నిజమైనదిగా కనిపించే వ్యక్తిత్వం కూడా ఉండాలి. ఈ స్మారక పనిలో ఇప్పుడు ఈ కంపెనీలు తమను తాము కనుగొంటున్నాయి.