ChatGPT இன் தொழில்நுட்பக் கட்டமைப்பைப் புரிந்துகொள்வது

செயற்கை நுண்ணறிவுத் துறையில் ChatGPT மிகவும் அற்புதமான பயன்பாடுகளில் ஒன்றாக உருவெடுத்துள்ளது. நவம்பர் 30, 2022 அன்று வெளியானதிலிருந்து, இரண்டு மாதங்களுக்குள் வியக்கத்தக்க 100 மில்லியன் மாதாந்திர செயலில் உள்ள பயனர்களைப் பெற்றுள்ளது, இது Instagram ஐ அடைய இரண்டரை ஆண்டுகள் எடுத்தது.

இந்த விரைவான வளர்ச்சி அதன் அடிப்படை தொழில்நுட்பம் மற்றும் கட்டிடக்கலை பற்றிய புதிரான கேள்விகளை எழுப்புகிறது. இந்தக் கட்டுரையில், ChatGPT எவ்வாறு செயல்படுகிறது என்பதை ஆராய்வோம், அதன் முக்கிய கூறுகள், பயிற்சி முறைகள் மற்றும் செயல்பாட்டு வழிமுறைகள் ஆகியவற்றில் கவனம் செலுத்துவோம்.

அடித்தளம்: பெரிய மொழி மாதிரிகள் (LLMs)

ChatGPT இன் இதயம் ஒரு பெரிய மொழி மாதிரி (LLM), குறிப்பாக GPT-3.5 மாறுபாடு. புதிய GPT-4 மாடல் இருந்தாலும், அதைப் பற்றிய விரிவான தொழில்நுட்ப தகவல்கள் இன்னும் குறைவாகவே உள்ளன. மனிதனைப் போன்ற உரையை ChatGPT எவ்வாறு உருவாக்குகிறது என்பதைப் புரிந்துகொள்வதற்கு ஒரு பெரிய மொழி மாதிரி என்ன என்பதைப் புரிந்துகொள்வது முக்கியம்.

ஒரு பெரிய மொழி மாதிரியானது விரிவான உரைத் தரவுகளில் பயிற்சியளிக்கப்பட்ட ஒரு வகையான நரம்பியல் நெட்வொர்க் ஆகும். பயிற்சி செயல்முறையானது, புள்ளியியல் வடிவங்கள் மற்றும் சொற்களுக்கு இடையே உள்ள உறவுமுறைகளைக் கற்றுக்கொள்வதற்கு மாதிரியை அனுமதிக்கிறது, இது முந்தைய சூழலின் அடிப்படையில் ஒரு வாக்கியத்தில் அடுத்த வார்த்தையைக் கணிக்க உதவுகிறது. ஒரு LLM இன் செயல்திறன் பெரும்பாலும் அதன் அளவு மற்றும் அது உள்ளடக்கிய அளவுருக்களின் எண்ணிக்கையைப் பொறுத்தது.

GPT-3.5 ஐ தனித்துவமாக்குவது எது?

GPT-3.5 என்பது இதுவரை உருவாக்கப்பட்ட மிகப்பெரிய ஆழமான கற்றல் மாதிரிகளில் ஒன்றாகும், இது அதன் நரம்பியல் நெட்வொர்க்கில் 96 அடுக்குகளில் விநியோகிக்கப்படும் 175 பில்லியன் அளவுருக்களை ஈர்க்கிறது. இந்த பாரிய அளவுகோல் இலக்கண ரீதியாக சரியானது மட்டுமல்லாமல், அது பயிற்றுவிக்கப்பட்ட தரவுகளுக்கு சொற்பொருள் ரீதியாகவும் பொருத்தமான உரையை உருவாக்க அனுமதிக்கிறது.

மாதிரியின் உள்ளீடு மற்றும் வெளியீடு டோக்கன்களைப் பயன்படுத்தி ஒழுங்கமைக்கப்படுகின்றன, அவை வார்த்தைகளின் எண் பிரதிநிதித்துவங்கள் அல்லது சொற்களின் பிரிவுகள். வார்த்தைகளை விட எண்களைப் பயன்படுத்துவதன் மூலம், மாதிரியானது தகவலை மிகவும் திறமையாக செயலாக்க முடியும். GPT-3.5 ஆனது 500 பில்லியன் டோக்கன்களில் பயிற்றுவிக்கப்பட்டது, இது பல்வேறு இணைய ஆதாரங்களில் இருந்து நூற்றுக்கணக்கான பில்லியன் வார்த்தைகளை மொழிபெயர்க்கிறது.

பயிற்சி செயல்முறை

GPT-3.5 இன் பயிற்சியானது முந்தைய டோக்கன்களின் அடிப்படையில் ஒரு வரிசையில் அடுத்த டோக்கனைக் கணிப்பதை உள்ளடக்கியது. மாடல் குறிப்பிடத்தக்க திறன்களை வெளிப்படுத்தும் அதே வேளையில், அது சரியாக வழிநடத்தப்படாவிட்டால், பொய்யான அல்லது தீங்கு விளைவிக்கும் வெளியீடுகளை உருவாக்கலாம். இந்த வரம்பு கட்டமைக்கப்பட்ட பயிற்சி மற்றும் உடனடி பொறியியலின் முக்கியத்துவத்தை எடுத்துக்காட்டுகிறது.

உடனடி பொறியியல்

ப்ராம்ட் இன்ஜினியரிங் என்பது ஒப்பீட்டளவில் புதிய துறையாகும், இது மொழி மாதிரிகளை திறம்பட பயன்படுத்துவதை எளிதாக்குகிறது. மாதிரியின் நடத்தையை வழிநடத்துவதற்கும், வெளியீடுகள் மனித மதிப்புகள் மற்றும் எதிர்பார்ப்புகளுடன் ஒத்துப்போவதை உறுதி செய்வதற்கும் உள்ளீடு தூண்டுதல்களை கவனமாக உருவாக்குவதை உள்ளடக்கியது. குறிப்பிட்ட வழிமுறைகளை வழங்குவதன் மூலம், பயனர்கள் பல்வேறு இயற்கை மொழிப் பணிகளைச் செய்ய மாதிரியை "கற்பிக்க" முடியும்.

வலுவூட்டல் கற்றல் மூலம் நன்றாகச் சரிசெய்தல்

ChatGPT இன் பாதுகாப்பு மற்றும் செயல்திறனை மேம்படுத்த, இந்த மாதிரியானது மனிதக் கருத்துகளிலிருந்து வலுவூட்டல் கற்றல் (RLHF) எனப்படும் ஒரு சிறந்த-சரிப்படுத்தும் செயல்முறைக்கு உட்படுகிறது. இந்த செயல்முறையானது அடிப்படை மாதிரியை மனித விருப்பங்கள் மற்றும் மதிப்புகளுடன் சிறப்பாக இணைக்கும் பதிப்பாக மாற்றுகிறது.

RLHF ஐப் புரிந்து கொள்ள, ஒரு சமையல்காரர் அவர்களின் திறமைகளைச் செம்மைப்படுத்தும் ஒப்புமையைக் கவனியுங்கள். ஆரம்பத்தில், சமையல்காரர் பரந்த அளவிலான சமையல் மற்றும் நுட்பங்களுடன் பயிற்சியளிக்கப்படுகிறார். இருப்பினும், குறிப்பிட்ட வாடிக்கையாளர் கோரிக்கைகளைப் பூர்த்தி செய்ய அவர்கள் போராடலாம். மேம்படுத்த, உணவகங்களில் இருந்து கருத்து சேகரிக்கப்படுகிறது, இது ஒப்பீட்டு தரவுத்தொகுப்பை உருவாக்க பயன்படுகிறது. சுவை மற்றும் விளக்கக்காட்சியின் அடிப்படையில் எந்தெந்த உணவுகள் விரும்பப்படுகின்றன என்பதைப் புரிந்துகொள்ள இந்த தரவுத்தொகுப்பு சமையல்காரருக்கு உதவுகிறது.

மனிதக் கருத்துகளிலிருந்து வலுவூட்டல் கற்றலில் படிகள்

  1. ஒரு ஒப்பீட்டு தரவுத்தொகுப்பை உருவாக்குதல்: கொடுக்கப்பட்ட ப்ராம்ட்க்கு மாதிரியானது பல பதில்களை உருவாக்குகிறது, பின்னர் அவை மனித மதிப்பீட்டாளர்களால் தரவரிசைப்படுத்தப்படுகின்றன.
  2. வெகுமதி மாடலிங்: பயனர் விருப்பங்களைப் புரிந்துகொள்வதில் மாதிரியை வழிநடத்தும் வெகுமதி மாதிரியை உருவாக்க பின்னூட்டம் பயன்படுத்தப்படுகிறது.
  3. ப்ராக்ஸிமல் பாலிசி ஆப்டிமைசேஷன் (பிபிஓ) உடன் பயிற்சி: மாடல் அதன் வெளியீடுகளை சிறிது மாற்றியமைக்கப்பட்ட பதிப்புகளுடன் ஒப்பிடுவதன் மூலம் அதன் பதில்களை மீண்டும் மேம்படுத்துகிறது, இது பயனர் எதிர்பார்ப்புகளைப் பூர்த்தி செய்யும் திறனை மேம்படுத்துகிறது.

இந்த மறுசெயல்முறை மாதிரியானது அதன் செயல்திறனைத் தொடர்ந்து செம்மைப்படுத்த அனுமதிக்கிறது, இது காலப்போக்கில் மிகவும் துல்லியமான மற்றும் சூழலுக்கு ஏற்ற பதில்களுக்கு வழிவகுக்கும்.

ChatGPT இன் செயல்பாட்டு இயக்கவியல்

மாடல் எவ்வாறு பயிற்சியளிக்கப்பட்டது மற்றும் சிறப்பாக வடிவமைக்கப்பட்டுள்ளது என்பதைப் பற்றி இப்போது எங்களுக்குத் தெரியும், ChatGPT எவ்வாறு பயனர் உள்ளீடுகளைச் செயலாக்குகிறது மற்றும் பதில்களை உருவாக்குகிறது என்பதைப் பற்றி ஆராய்வோம். ChatGPT இன் செயல்பாடானது சூழல் விழிப்புணர்வு மற்றும் உடனடித் துல்லியத்தை உறுதி செய்யும் பல-படி செயல்முறையாகும்.

சூழல் சார்ந்த புரிதல்

உரையாடல் உடனடி ஊசியைப் பயன்படுத்தி ChatGPT சூழலைப் பராமரிக்கிறது. ஒவ்வொரு முறையும் ஒரு பயனர் புதிய ப்ராம்ட்டை உள்ளிடும்போது, ​​உரையாடலின் முழு வரலாறும் மாதிரியில் கொடுக்கப்படும். இந்த முறையானது, முந்தைய பரிமாற்றங்களுக்கு ஒத்திசைவான மற்றும் சூழல் சார்ந்த பதில்களை உருவாக்க மாதிரியை அனுமதிக்கிறது.

முதன்மை உடனடி பொறியியல்

சூழ்நிலை விழிப்புணர்வுக்கு கூடுதலாக, ChatGPT முதன்மை உடனடி பொறியியலைப் பயன்படுத்துகிறது. உரையாடல் தொனியை நோக்கி மாதிரியை வழிகாட்டுவதற்கு பயனரின் அறிவுறுத்தலுக்கு முன்னும் பின்னும் குறிப்பிட்ட வழிமுறைகளைச் செருகுவது இதில் அடங்கும். இந்த வழிகாட்டுதல்கள் பயனருக்குத் தெரிவதில்லை ஆனால் வெளியீட்டை வடிவமைப்பதில் முக்கியப் பங்கு வகிக்கின்றன.

மிதமான மற்றும் பாதுகாப்பு வழிமுறைகள்

ChatGPT இன் செயல்பாட்டின் மற்றொரு முக்கியமான அம்சம் ஒரு மிதமான API ஐப் பயன்படுத்துவதாகும். பதில்களை உருவாக்கும் முன், பாதுகாப்பற்ற உள்ளடக்கத்தைக் கண்டறிந்து எச்சரிக்க இந்த API மூலம் உள்ளீடு ப்ராம்ட் அனுப்பப்படுகிறது. இதேபோல், தீங்கு விளைவிக்கும் பொருட்களின் பரவலைத் தடுக்க உருவாக்கப்பட்ட பதில் மதிப்பீடு செய்யப்படுகிறது.

ChatGPT மற்றும் AI இன் எதிர்காலம்

செயற்கை நுண்ணறிவு மற்றும் இயற்கை மொழி செயலாக்கத்தில் புதிய வாய்ப்புகளுக்கு வழி வகுத்து, ChatGPTக்குப் பின்னால் உள்ள தொழில்நுட்பம் தொடர்ந்து உருவாகி வருகிறது. பொறியாளர்கள் மற்றும் ஆராய்ச்சியாளர்கள் இந்த மாதிரிகளைச் செம்மைப்படுத்த வேலை செய்வதால், மேம்படுத்தப்பட்ட திறன்களையும் பாதுகாப்பு நடவடிக்கைகளையும் எதிர்பார்க்கலாம், இறுதியில் நாம் எவ்வாறு தொடர்பு கொள்கிறோம் மற்றும் இயந்திரங்களுடன் தொடர்பு கொள்கிறோம் என்பதை மாற்றியமைக்கிறோம்.

முடிவுரை

சுருக்கமாக, அதிநவீன பயிற்சி முறைகள் மற்றும் செயல்பாட்டு உத்திகளால் இயக்கப்படும் செயற்கை நுண்ணறிவு துறையில் குறிப்பிடத்தக்க முன்னேற்றத்தை ChatGPT பிரதிபலிக்கிறது. ஒரு பெரிய மொழி மாதிரியாக அதன் அடித்தளம் முதல் வலுவூட்டல் கற்றல் மூலம் அதன் நுணுக்கமாக்கல் வரை, ஒவ்வொரு அம்சமும் அதன் ஈர்க்கக்கூடிய செயல்திறனுக்கு பங்களிக்கிறது. AI தொழில்நுட்பம் தொடர்ந்து வளர்ச்சியடைந்து வருவதால், அதன் தாக்கங்கள் மற்றும் அதனுடன் வரும் பொறுப்புகள் குறித்து நாம் விழிப்புடன் இருக்க வேண்டும்.

கணினி வடிவமைப்பு மற்றும் பெரிய அளவிலான அமைப்புகளின் போக்குகள் பற்றி மேலும் ஆராய ஆர்வமுள்ளவர்கள், எங்கள் செய்திமடலுக்கு குழுசேரவும். 250,000 க்கும் மேற்பட்ட வாசகர்களால் நம்பப்படும் நுண்ணறிவுகளுடன், இந்த சிக்கலான தலைப்புகளில் தங்கள் புரிதலை ஆழப்படுத்த விரும்பும் எவருக்கும் இது ஒரு மதிப்புமிக்க ஆதாரமாகும்.

வலைப்பதிவுக்குத் திரும்பு