OpenAI వంటి దిగ్గజాల నేతృత్వంలో కృత్రిమ మేధస్సు (AI) అభివృద్ధి నిరంతరం సాగుతోంది, ఇది మేధో సంపత్తి మరియు డేటా యాజమాన్యం యొక్క దీర్ఘకాలిక సూత్రాలతో తరచుగా సంఘర్షణకు దారితీస్తుంది. OpenAI యొక్క సరికొత్త ఫ్లాగ్షిప్ మోడల్, GPT-4o, పేవాల్స్ వెనుక ఉన్న కాపీరైట్ చేయబడిన మెటీరియల్లను ఉపయోగించి శిక్షణ పొంది ఉండవచ్చని, అవసరమైన అనుమతులు పొందకుండానే ఇది జరిగి ఉండవచ్చని తాజా ఆరోపణలు వెలువడటంతో ఈ సంఘర్షణ మరోసారి వివాదాన్ని రేకెత్తించింది. ఈ ఆరోపణలు కొత్తగా స్థాపించబడిన వాచ్డాగ్ గ్రూప్, AI డిస్క్లోజర్స్ ప్రాజెక్ట్ నుండి వచ్చాయి, ఇది అధునాతన AI వ్యవస్థల శిక్షణ కోసం డేటాను నైతికంగా సేకరించడం చుట్టూ ఇప్పటికే ఉన్న సంక్లిష్టమైన చర్చకు మరో పొరను జోడిస్తుంది.
వాచ్డాగ్ మొరుగు: AI డిస్క్లోజర్స్ ప్రాజెక్ట్ నుండి ఆరోపణలు
2024లో ప్రారంభించబడిన, AI డిస్క్లోజర్స్ ప్రాజెక్ట్ AI పరిశ్రమలో తరచుగా అపారదర్శకంగా ఉండే పద్ధతులను పరిశీలించడానికి అంకితమైన లాభాపేక్షలేని సంస్థగా తనను తాను నిలబెట్టుకుంది. దీని వ్యవస్థాపకులలో మీడియా వ్యవస్థాపకుడు Tim O’Reilly, ప్రముఖ సాంకేతిక పుస్తకాల ప్రచురణకర్త O’Reilly Media వ్యవస్థాపకుడు మరియు ఆర్థికవేత్త Ilan Strauss వంటి ప్రముఖ వ్యక్తులు ఉన్నారు. O’Reilly Media తో ఈ అనుబంధం ప్రత్యేకంగా సంబంధితమైనది, ఎందుకంటే ప్రాజెక్ట్ యొక్క ప్రారంభ బాంబు నివేదిక ప్రత్యేకంగా GPT-4o యొక్క శిక్షణ డేటాసెట్లో O’Reilly యొక్క పేవాల్డ్ పుస్తక కంటెంట్ ఉన్నట్లు ఆరోపణలపై దృష్టి పెడుతుంది.
వారి అధ్యయనం యొక్క కేంద్ర వాదన రెచ్చగొట్టేది: OpenAI మరియు O’Reilly Media మధ్య ఎటువంటి తెలిసిన లైసెన్సింగ్ ఒప్పందం లేనప్పటికీ, GPT-4o మోడల్ O’Reilly యొక్క కాపీరైట్ చేయబడిన పుస్తకాల నుండి నేరుగా పొందిన కంటెంట్తో గుర్తించదగిన అధిక స్థాయి పరిచయాన్ని ప్రదర్శిస్తుంది. ఈ పరిచయం, నివేదిక వాదిస్తుంది, ఈ పేవాల్డ్ మెటీరియల్స్ మోడల్ సామర్థ్యాలను నిర్మించడానికి ఉపయోగించిన విస్తారమైన డేటా కార్పస్లో చేర్చబడ్డాయని బలంగా సూచిస్తుంది. ఈ అధ్యయనం పాత OpenAI మోడల్స్, ముఖ్యంగా GPT-3.5 Turbo తో పోలిస్తే గణనీయమైన వ్యత్యాసాన్ని హైలైట్ చేస్తుంది, ఇది GPT-4o అభివృద్ధికి దారితీసిన డేటా సేకరణ పద్ధతులలో సంభావ్య మార్పు లేదా విస్తరణను సూచిస్తుంది.
దీని పర్యవసానాలు గణనీయమైనవి. యాజమాన్య, చెల్లింపు కంటెంట్ను AI మోడల్స్ అధికారం లేదా పరిహారం లేకుండా తీసుకుంటుంటే, అది ఉత్పాదక AI యుగంలో కాపీరైట్ చట్టం గురించి ప్రాథమిక ప్రశ్నలను లేవనెత్తుతుంది. ప్రచురణకర్తలు మరియు రచయితలు వారి కంటెంట్ యొక్క ప్రత్యేకతపై ఆధారపడిన చందా లేదా కొనుగోలు నమూనాలపై ఆధారపడతారు. శిక్షణ కోసం ఈ మెటీరియల్ యొక్క ఆరోపిత ఉపయోగం ఈ వ్యాపార నమూనాలను బలహీనపరుస్తున్నట్లు చూడవచ్చు, సృష్టించడానికి గణనీయమైన పెట్టుబడి అవసరమయ్యే కంటెంట్ను సంభావ్యంగా విలువ తగ్గిస్తుంది. ఈ నిర్దిష్ట ఆరోపణ బహిరంగంగా అందుబాటులో ఉన్న వెబ్సైట్లను స్క్రాప్ చేయడాన్ని దాటి, చెల్లించే కస్టమర్ల కోసం స్పష్టంగా ఉద్దేశించిన కంటెంట్ను యాక్సెస్ చేసే భూభాగంలోకి ప్రవేశిస్తుంది.
బ్లాక్ బాక్స్ లోపల చూడటం: మెంబర్షిప్ ఇన్ఫరెన్స్ ఎటాక్
వారి వాదనలను ధృవీకరించడానికి, AI డిస్క్లోజర్స్ ప్రాజెక్ట్లోని పరిశోధకులు ‘మెంబర్షిప్ ఇన్ఫరెన్స్ ఎటాక్’ అని పిలువబడే ఒక అధునాతన సాంకేతికతను ఉపయోగించారు, ప్రత్యేకంగా వారు DE-COP అని పిలిచే పద్ధతిని ఉపయోగించారు. ఈ విధానం వెనుక ఉన్న ప్రధాన ఆలోచన ఏమిటంటే, ఒక AI మోడల్ నిర్దిష్ట టెక్స్ట్ భాగాలను ‘గుర్తుంచుకుందా’ లేదా కనీసం బలమైన పరిచయాన్ని పెంచుకుందా అని పరీక్షించడం. ముఖ్యంగా, ఈ దాడి మోడల్ను అసలు టెక్స్ట్ పాసేజ్ల (ఈ సందర్భంలో, O’Reilly పుస్తకాల నుండి) మరియు అదే పాసేజ్ల యొక్క జాగ్రత్తగా నిర్మించిన పారాఫ్రేజ్డ్ వెర్షన్ల (మరొక AI ద్వారా రూపొందించబడినవి) మధ్య విశ్వసనీయంగా తేడాను గుర్తించగలదా అని పరిశీలిస్తుంది.
దీని వెనుక ఉన్న తర్కం ఏమిటంటే, ఒక మోడల్ స్థిరంగా అసలు మానవ-రచించిన టెక్స్ట్ను దగ్గరి పారాఫ్రేజ్తో పోలిస్తే యాదృచ్ఛికం కంటే ఎక్కువ సామర్థ్యాన్ని చూపిస్తే, మోడల్ ఆ అసలు టెక్స్ట్ను ఇంతకు ముందు ఎదుర్కొందని సూచిస్తుంది - బహుశా దాని శిక్షణ దశలో. ఇది ఎవరైనా తాము ఎప్పుడూ చూడలేదని చెప్పుకునే నిర్దిష్ట, తక్కువ-తెలిసిన ఫోటోగ్రాఫ్ను గుర్తిస్తారా అని పరీక్షించడం లాంటిది; స్థిరమైన గుర్తింపు మునుపటి బహిర్గతాన్ని సూచిస్తుంది.
AI డిస్క్లోజర్స్ ప్రాజెక్ట్ యొక్క పరీక్ష స్థాయి గణనీయమైనది. వారు 34 విభిన్న O’Reilly Media పుస్తకాల నుండి తీసుకోబడిన 13,962 విభిన్న పేరాగ్రాఫ్ ఉల్లేఖనాలను ఉపయోగించారు. ఈ ఉల్లేఖనాలు సాధారణంగా ప్రచురణకర్త యొక్క పేవాల్ వెనుక కనిపించే ప్రత్యేకమైన, అధిక-విలువ కంటెంట్ రకాన్ని సూచిస్తాయి. అధ్యయనం అప్పుడు GPT-4o మరియు దాని పూర్వీకుడు, GPT-3.5 Turbo రెండింటి పనితీరును ఈ భేదాత్మక పనిపై కొలిచింది.
నివేదికలో సమర్పించిన ఫలితాలు ఆశ్చర్యకరంగా ఉన్నాయి. GPT-4o పేవాల్డ్ O’Reilly కంటెంట్ను గుర్తించడంలో గణనీయంగా పెరిగిన సామర్థ్యాన్ని ప్రదర్శించింది. దాని పనితీరును AUROC (Area Under the Receiver Operating Characteristic curve) స్కోర్ను ఉపయోగించి లెక్కించారు, ఇది బైనరీ క్లాసిఫైయర్ల పనితీరును మూల్యాంకనం చేయడానికి ఒక సాధారణ మెట్రిక్. GPT-4o 82% AUROC స్కోర్ను సాధించింది. దీనికి విరుద్ధంగా, GPT-3.5 Turbo కేవలం 50% కంటే కొంచెం ఎక్కువ స్కోర్ చేసింది, ఇది తప్పనిసరిగా యాదృచ్ఛిక అంచనాకు సమానం - పరీక్షించిన మెటీరియల్ యొక్క నిర్దిష్ట గుర్తింపు చాలా తక్కువ లేదా లేదని సూచిస్తుంది. ఈ స్పష్టమైన వ్యత్యాసం, నివేదిక వాదిస్తుంది, పేవాల్డ్ కంటెంట్ వాస్తవానికి GPT-4o యొక్క శిక్షణ ఆహారంలో భాగమని బలవంతపు, పరోక్ష సాక్ష్యాలను అందిస్తుంది. 82% స్కోర్ బలమైన సంకేతాన్ని సూచిస్తుంది, ఇది యాదృచ్ఛికంగా లేదా సాధారణీకరించిన జ్ఞానం ద్వారా ఊహించిన దానికంటే చాలా ఎక్కువ.
అవసరమైన హెచ్చరికలు మరియు సమాధానం లేని ప్రశ్నలు
కనుగొన్నవి బలవంతపు కథనాన్ని ప్రదర్శిస్తున్నప్పటికీ, AI పరిశోధకుడు Sruly Rosenblat తో సహా అధ్యయనం యొక్క సహ-రచయితలు, వారి పద్దతిలో మరియు AI శిక్షణ యొక్క సంక్లిష్ట స్వభావంలో అంతర్లీనంగా ఉన్న సంభావ్య పరిమితులను ప్రశంసనీయంగా అంగీకరిస్తారు. వారు లేవనెత్తిన ఒక ముఖ్యమైన హెచ్చరిక పరోక్ష డేటా ఇంజెషన్ యొక్క అవకాశం. ChatGPT (OpenAI యొక్క ప్రసిద్ధ ఇంటర్ఫేస్) వినియోగదారులు పేవాల్డ్ O’Reilly పుస్తకాల నుండి ఉల్లేఖనాలను నేరుగా చాట్ ఇంటర్ఫేస్లోకి కాపీ చేసి పేస్ట్ చేసి ఉండవచ్చని వారు గమనించారు, టెక్స్ట్ గురించి ప్రశ్నలు అడగడం లేదా సారాంశాలను అభ్యర్థించడం వంటి వివిధ ప్రయోజనాల కోసం. ఇది తగినంత తరచుగా జరిగితే, మోడల్ ప్రారంభ శిక్షణ డేటాసెట్లో ప్రత్యక్ష చేరిక ద్వారా కాకుండా వినియోగదారు పరస్పర చర్యల ద్వారా పరోక్షంగా కంటెంట్ను నేర్చుకుని ఉండవచ్చు. ప్రత్యక్ష శిక్షణ బహిర్గతాన్ని వినియోగదారు ప్రాంప్ట్ల ద్వారా పరోక్ష అభ్యాసం నుండి వేరు చేయడం AI ఫోరెన్సిక్స్లో ఒక ముఖ్యమైన సవాలుగా మిగిలిపోయింది.
ఇంకా, అధ్యయనం యొక్క పరిధి OpenAI యొక్క సంపూర్ణ తాజా లేదా ప్రత్యేక మోడల్ పునరావృత్తులకు విస్తరించలేదు, అవి GPT-4o యొక్క ప్రధాన శిక్షణ చక్రానికి ఏకకాలంలో లేదా తరువాత అభివృద్ధి చేయబడి లేదా విడుదల చేయబడి ఉండవచ్చు. సంభావ్యంగా GPT-4.5 (అది ఆ నిర్దిష్ట నామకరణం లేదా సామర్థ్య స్థాయిలో ఉంటే) మరియు o3-mini మరియు o1 వంటి తార్కికం-కేంద్రీకృత మోడల్స్ వంటి మోడల్స్ అదే మెంబర్షిప్ ఇన్ఫరెన్స్ దాడులకు గురికాలేదు. డేటా సోర్సింగ్ పద్ధతులు మరింతగా అభివృద్ధి చెంది ఉండవచ్చా లేదా ఈ కొత్త మోడల్స్ పేవాల్డ్ కంటెంట్తో సారూప్యమైన పరిచయ నమూనాలను ప్రదర్శిస్తాయా అనే ప్రశ్నను ఇది తెరిచి ఉంచుతుంది. AI అభివృద్ధిలో వేగవంతమైన పునరావృత చక్రాలు అంటే ఏదైనా స్నాప్షాట్ విశ్లేషణ దాదాపు వెంటనే కొద్దిగా పాతబడిపోయే ప్రమాదం ఉంది.
ఈ పరిమితులు అధ్యయనం యొక్క ప్రధాన కనుగొన్నలను తప్పనిసరిగా చెల్లుబాటు చేయవు, కానీ అవి కీలకమైన సూక్ష్మ నైపుణ్యాలను జోడిస్తాయి. ఫౌండేషన్ మోడల్కు శిక్షణ ఇవ్వడానికి ఉపయోగించిన టెరాబైట్ల డేటాలో ఖచ్చితంగా ఏమి ఉందో నిరూపించడం చాలా కష్టం. మెంబర్షిప్ ఇన్ఫరెన్స్ దాడులు సంభావ్యత ఆధారిత సాక్ష్యాలను అందిస్తాయి, సంపూర్ణ నిశ్చయతను అందించడం కంటే సంభావ్యతను సూచిస్తాయి. OpenAI, ఇతర AI ల్యాబ్ల వలె, దాని శిక్షణ డేటా కూర్పును యాజమాన్య ఆందోళనలు మరియు పోటీ సున్నితత్వాలను ఉటంకిస్తూ దగ్గరగా కాపాడుతుంది.
విస్తృత సంఘర్షణ: AI రంగంలో కాపీరైట్ యుద్ధాలు
AI డిస్క్లోజర్స్ ప్రాజెక్ట్ ద్వారా లేవనెత్తిన ఆరోపణలు శూన్యంలో లేవు. శిక్షణ ప్రయోజనాల కోసం కాపీరైట్ చేయబడిన మెటీరియల్ వాడకంపై AI డెవలపర్లు మరియు సృష్టికర్తల మధ్య చాలా విస్తృతమైన, కొనసాగుతున్న సంఘర్షణలో అవి తాజా ఘర్షణను సూచిస్తాయి. OpenAI, Google, Meta, మరియు Microsoft వంటి ఇతర ప్రముఖ ఆటగాళ్లతో పాటు, బహుళ ఉన్నత-స్థాయి వ్యాజ్యాలలో చిక్కుకుంది. రచయితలు, కళాకారులు, వార్తా సంస్థలు మరియు ఇతర హక్కుదారులచే తీసుకురాబడిన ఈ చట్టపరమైన సవాళ్లు, ఉత్పాదక AI మోడళ్లకు శిక్షణ ఇవ్వడానికి ఇంటర్నెట్ నుండి భారీ మొత్తంలో టెక్స్ట్ మరియు చిత్రాలను అనధికారికంగా స్క్రాప్ చేయడం మరియు ఇంజెస్ట్ చేయడం వల్ల ఉత్పన్నమయ్యే విస్తృతమైన కాపీరైట్ ఉల్లంఘనను సాధారణంగా ఆరోపిస్తాయి.
AI కంపెనీలు తరచుగా లేవనెత్తే ప్రధాన రక్షణ ఫెయిర్ యూజ్ సిద్ధాంతం (యునైటెడ్ స్టేట్స్లో) లేదా ఇతర అధికార పరిధిలోని సారూప్య మినహాయింపులపై ఆధారపడి ఉంటుంది. శిక్షణ కోసం కాపీరైట్ చేయబడిన పనులను ఉపయోగించడం ‘పరివర్తనాత్మక’ ఉపయోగం అని వారు వాదిస్తారు - AI మోడల్స్ కేవలం అసలు పనులను పునరుత్పత్తి చేయడం లేదు, కానీ పూర్తిగా కొత్త అవుట్పుట్లను రూపొందించడానికి నమూనాలు, శైలులు మరియు సమాచారాన్ని నేర్చుకోవడానికి డేటాను ఉపయోగిస్తున్నాయి. ఈ వ్యాఖ్యానం ప్రకారం, శక్తివంతమైన కొత్త సాధనాన్ని సృష్టించడం లక్ష్యంగా పెట్టుకున్న శిక్షణ ప్రక్రియ, ఇంజెస్ట్ చేయబడిన ప్రతి డేటా ముక్కకు లైసెన్స్లు అవసరం లేకుండా అనుమతించబడాలి.
అయితే, హక్కుదారులు ఈ అభిప్రాయాన్ని తీవ్రంగా వ్యతిరేకిస్తున్నారు. కాపీయింగ్ యొక్క భారీ స్థాయి, నిర్మించబడుతున్న AI ఉత్పత్తుల వాణిజ్య స్వభావం మరియు AI అవుట్పుట్లు అసలు పనులతో నేరుగా పోటీపడి వాటి స్థానంలోకి వచ్చే అవకాశం ఫెయిర్ యూజ్ కనుగొన్నలకు వ్యతిరేకంగా బలంగా బరువు కలిగిస్తాయని వారు వాదిస్తారు. సృష్టికర్తలకు పరిహారం చెల్లించకుండా AI కంపెనీలు సృజనాత్మక పని వెనుక బిలియన్ డాలర్ల సంస్థలను నిర్మిస్తున్నాయని వాదన.
ఈ వివాదాస్పద నేపథ్యానికి వ్యతిరేకంగా, OpenAI వివిధ కంటెంట్ ప్రొవైడర్లతో లైసెన్సింగ్ ఒప్పందాలను కుదుర్చుకోవడం ద్వారా కొన్ని నష్టాలను తగ్గించడానికి చురుకుగా ప్రయత్నించింది. ప్రధాన వార్తా ప్రచురణకర్తలు (Associated Press మరియు Axel Springer వంటివి), సోషల్ మీడియా ప్లాట్ఫారమ్లు (Reddit వంటివి), మరియు స్టాక్ మీడియా లైబ్రరీలు (Shutterstock వంటివి) తో ఒప్పందాలు ప్రకటించబడ్డాయి. ఈ ఒప్పందాలు OpenAI కి చెల్లింపుకు బదులుగా నిర్దిష్ట డేటాసెట్లకు చట్టబద్ధమైన ప్రాప్యతను అందిస్తాయి, సంభావ్యంగా ఉల్లంఘించే వెబ్-స్క్రాప్డ్ డేటాపై దాని ఆధారపడటాన్ని తగ్గిస్తాయి. కంపెనీ జర్నలిస్టులను కూడా నియమించుకున్నట్లు నివేదించబడింది, దాని మోడల్స్ యొక్క అవుట్పుట్ల నాణ్యత మరియు విశ్వసనీయతను మెరుగుపరచడంలో సహాయపడటానికి వారిని నియమించింది, ఇది అధిక-నాణ్యత, సంభావ్యంగా క్యూరేటెడ్, ఇన్పుట్ అవసరం గురించి అవగాహనను సూచిస్తుంది.
అలల ప్రభావం: కంటెంట్ పర్యావరణ వ్యవస్థ ఆందోళనలు
AI డిస్క్లోజర్స్ ప్రాజెక్ట్ యొక్క నివేదిక OpenAI కోసం తక్షణ చట్టపరమైన చిక్కులకు మించి దాని ఆందోళనలను విస్తరించింది. ఇది మొత్తం డిజిటల్ కంటెంట్ పర్యావరణ వ్యవస్థ యొక్క ఆరోగ్యం మరియు వైవిధ్యాన్ని ప్రతికూలంగా ప్రభావితం చేసే దైహిక ముప్పుగా సమస్యను ఫ్రేమ్ చేస్తుంది. అధ్యయనం సంభావ్యంగా నష్టపరిచే ఫీడ్బ్యాక్ లూప్ను ప్రతిపాదిస్తుంది: AI కంపెనీలు అధిక-నాణ్యత, వృత్తిపరంగా సృష్టించబడిన కంటెంట్ను (పేవాल्ड మెటీరియల్తో సహా) సృష్టికర్తలకు పరిహారం చెల్లించకుండా స్వేచ్ఛగా ఉపయోగించగలిగితే, అది అటువంటి కంటెంట్ను ఉత్పత్తి చేయడంలో ఆర్థిక సాధ్యతను క్షీణింపజేస్తుంది.
వృత్తిపరమైన కంటెంట్ సృష్టి - అది పరిశోధనాత్మక జర్నలిజం, లోతైన సాంకేతిక మాన్యువల్స్, ఫిక్షన్ రైటింగ్, లేదా అకడమిక్ రీసెర్చ్ అయినా - తరచుగా గణనీయమైన సమయం, నైపుణ్యం మరియు ఆర్థిక పెట్టుబడి అవసరం. పేవాల్స్ మరియు చందా నమూనాలు తరచుగా ఈ పనికి నిధులు సమకూర్చడానికి అవసరమైన యంత్రాంగాలు. ఈ ప్రయత్నాలకు మద్దతు ఇచ్చే ఆదాయ మార్గాలు తగ్గిపోతే, ఎందుకంటే కంటెంట్ సమర్థవంతంగా పోటీ AI వ్యవస్థలకు శిక్షణ ఇవ్వడానికి పరిహారం లేకుండా ఉపయోగించబడుతోంది, అధిక-నాణ్యత, విభిన్న కంటెంట్ను సృష్టించే ప్రోత్సాహం క్షీణించవచ్చు. ఇది తక్కువ సమాచారం ఉన్న ప్రజలకు, ప్రత్యేక జ్ఞాన వనరుల తగ్గింపుకు మరియు సంభావ్యంగా మానవ నైపుణ్యం మరియు ధృవీకరణ లేని తక్కువ-నాణ్యత లేదా AI- రూపొందించిన కంటెంట్తో ఆధిపత్యం చెలాయించే ఇంటర్నెట్కు దారితీయవచ్చు.
పర్యవసానంగా, AI డిస్క్లోజర్స్ ప్రాజెక్ట్ వారి శిక్షణ డేటా పద్ధతులకు సంబంధించి AI కంపెనీల నుండి ఎక్కువ పారదర్శకత మరియు జవాబుదారీతనం కోసం బలంగా వాదిస్తుంది. వాణిజ్య AI మోడల్స్ అభివృద్ధికి వారి పని దోహదపడినప్పుడు కంటెంట్ సృష్టికర్తలకు న్యాయంగా పరిహారం చెల్లించబడుతుందని నిర్ధారించే బలమైన విధానాలు మరియు సంభావ్య నియంత్రణ ఫ్రేమ్వర్క్ల అమలుకు వారు పిలుపునిచ్చారు. ఇది ప్రపంచవ్యాప్తంగా సృష్టికర్త సమూహాల నుండి విస్తృత పిలుపులను ప్రతిధ్వనిస్తుంది, వారు వారి మేధో సంపత్తిపై శిక్షణ పొందిన AI వ్యవస్థల ద్వారా ఉత్పత్తి చేయబడిన విలువలో వాటాను పొందేలా చూసుకోవడానికి యంత్రాంగాలను - లైసెన్సింగ్ ఒప్పందాలు, రాయల్టీ వ్యవస్థలు లేదా సామూహిక బేరసారాల ద్వారా - కోరుకుంటారు. మానవ సృజనాత్మకత మరియు జ్ఞాన ఉత్పత్తి కోసం అభివృద్ధి చెందుతున్న పర్యావరణ వ్యవస్థతో పాటు AI ఆవిష్కరణలు వర్ధిల్లగల స్థిరమైన సమతుల్యతను కనుగొనడంపై చర్చ కేంద్రీకృతమై ఉంది. కొనసాగుతున్న చట్టపరమైన పోరాటాల పరిష్కారం మరియు కొత్త చట్టం లేదా పరిశ్రమ ప్రమాణాల సంభావ్యత ఈ భవిష్యత్ సమతుల్యతను రూపొందించడంలో కీలకం అవుతుంది. భారీ, సంక్లిష్టమైన AI మోడల్స్లో డేటా మూలాన్ని ట్రాక్ చేయడం మరియు విలువను ఆపాదించడం ఎలా అనే ప్రశ్న ఒక ముఖ్యమైన సాంకేతిక మరియు నైతిక అడ్డంకిగా మిగిలిపోయింది.