நில் நிதானி கணினி

Related image

முன்பெல்லாம் கணினியைப் படித்தோம், இன்று கணினியில் படிக்கிறோம். கணினி படிப்பைக் குறித்த பார்வை இன்று இப்படி விரிவடைந்திருக்கிறது. கணினி என்பது இனிமேல் ஒரு தனிப் பாடமல்ல, எந்தப் பாடத்தையும் இணைக்கும் பாலம் என்பதையே புதிய தொழில்நுட்பக் கல்வி நமக்கு எடுத்துக் கூறுகிறது.

சார்லஸ் பேபேஜ் பத்தொன்பதாம் நூற்றாண்டில் கணினியைக் கண்டுபிடித்தபோது அது இத்தகைய விஸ்வரூப வளர்ச்சியடையும் என எதிர்பார்த்திருக்க வாய்ப்பில்லை. கூட்டல் கழித்தல் போடுகின்ற ஒரு கேல்குலேட்டர் போல தான் அதன் முதல் பிரசவம் இருந்தது. அது படிப்படையாக வளர்ச்சியடைந்து, ஆயிரத்து தொள்ளாயிரத்து முப்பத்து ஏழில் முதல் தலைமுறை கணினி உருவானது.எலக்ட்ரானிக் நியூமரிகல் இன்டிகிரேட்டர் அன்ட் கம்ப்யூட்டர் என்பது தான் அப்போதைய பெயர்.

பெயரைப் போலவே அது அளவிலும் மிகப்பெரியதாக இருந்தது. சுமார் பதினெட்டாயிரம் வேக்யூம் டியூப்கள் ஒரு கணினியில் இருந்தன. அதை பாதுகாப்பாக வைக்க சுமார் முக்கால் கிரவுண்ட் நிலம் தேவைப்பட்டது ! அதன் எடை சுமார் முப்பதாயிரம் கிலோ என்றால் பார்த்துக் கொள்ளுங்கள். இன்றைய கணினிகளோடு ஒப்பிடுகையில் வளர்ச்சி வியப்பூட்டுகிறது.

நமது அன்றாட வாழ்க்கையை இன்றைய கணினி யுகம் தலைகீழாய்ப் புரட்டிப் போட்டுவிட்டது என்று சொல்லலாம். குறிப்பாக இணையம் வந்தபின்பு கணினி தொழில்நுட்பம் கரைபுரண்ட காட்டாறுபோல திமிறிப் பாய்ந்து விட்டது. யாரும் எதிர்பார்க்காத அளவுக்கு உலகத்தை ஒற்றை புள்ளியில் கொண்டு வந்து சேர்த்து விட்டது.

திரைகடல் ஓடியும் திரவியம் தேடு என்பதெல்லாம் பழைய கதையாகி, வலைகடல் ஓடி திரவியம் தேடு எனும் புது மொழியில் இன்றைய தொழில்நுட்ப உலகம் பயணிக்கிறது.

‘ஊருக்கு போனதும் கடுதாசி போடுப்பா’ என்று யாரும் இன்றைக்கு சொல்வதில்லை. பயணம் செய்ய ஆரம்பித்த நொடி முதல் ஒவ்வொரு நிமிடமும் நாம் எங்கே இருக்கிறோம் என்பதை ஜிபிஎஸ் டிராக் செய்கிறது. அதை வீட்டிலிருந்தபடியே அம்மாக்கள் கண்டு நிம்மதிப் பெருமூச்சு விடுகிறார்கள்.

இன்லென்ட் என்றால் என்ன ? தபால் நிலையம் என்பது பால் விற்கும் இடைமா ? என்றெல்லாம் கேள்வி கேட்கக்கூடிய புதிய தலைமுறையை இன்றைய கணினி யுகம் உருவாக்கியிருக்கிறது.

பழைய கால திரைப்படங்களில் கிளைமேக்ஸ் காட்சியில் கதாநாயகியை அவளது தந்தை ரயிலிலோ, விமானத்திலோ ஏற்றிக் கொண்டு சென்றுவிடுவார். காதலர்கள் பிரிந்து விடுவார்கள். கண்ணைக் கசக்கிக் கொண்டே பார்வையாளர்களும் பிரிந்து விடுவார்கள். அப்படி ஒரு கிளைமேக்ஸ் வைத்தால் இன்று சிரிப்பார்கள். உலகின் எந்த மூலையில் இருந்தாலும் முகம் பார்த்துப் பேசும் தொழில்நுட்பங்கள் நமது கையடக்கக் கருவிகளில் வந்துவிட்டன.

சமூக வலைத்தளங்களின் வரவுக்குப் பின்பு உலகின் நட்பு வட்டாரங்களெல்லாம் டிஜிடல் குட்டிச் சுவற்றில் வந்தமர்ந்து விட்டன. அரட்டைகளும், பரிமாற்றங்களும் சாதாரண சங்கதிகளாகிவிட்டன. பள்ளிக்கூட நண்பர்கள், கல்லூரி நண்பர்கள், குடும்ப உறுப்பினர்கள் என உறவுகளின் இழைகள் அனைத்தையும் எப்போது வேண்டுமானாலும் தொடர்பில் கொண்டிருக்கக் கூடிய ஒரு சூழலை கணினி யுகம் நமக்கு உருவாக்கித் தந்திருக்கிறது.

கடந்த தலைமுறைக்கும், இந்த தலைமுறைக்கும் இடையேயான மிகப்பெரிய இடைவெளியாய் இந்த தொழில்நுட்பப் புரட்சியைச் சொல்லலாம். எந்த முன்பதிவுக்கும் அலுவலகம் சென்று வரிசையில் நிற்கத் தேவையில்லை, எந்த பில் கட்டவும் அரசு அலுவலகங்களில் செல்லத் தேவையில்லை, பணத் தேவைக்காய் வங்கிகளில் டோக்கன் வாங்கி நொந்து கொள்ளத் தேவையில்லை, கடிதம் அனுப்ப ஸ்டாம்ப் தேடித் திரியத் தேவையில்லை, ஏன் சாப்பிடுவதற்குக் கூட சமைக்கத் தேவையில்லை எனும் நிலமையை கணினி யுகம் உருவாக்கித் தந்திருக்கிறது.

கேமரா, ரேடியோ, டேப்ரிக்கார்டர், டிவிடி பிளேயர், தபால் நிலையம், வங்கி என சர்வத்தையும் உள்ளடக்கியபடி கணினி நுட்பத்தின் வசீகரமாய் போன்கள் கரங்களில் இருக்கின்றன. இனியும் இவை அடையப் போகின்ற எல்லைகளை நினைத்தால் பிரமிப்பாய் இருக்கிறது.

கணினி யுகம் அழிந்து விடும், கணினி தொழில்நுட்பம் முடிந்து விடும் என்றெல்லாம் ஒவ்வொரு காலகட்டத்திலும் ஊகங்கள் வெளியாவதுண்டு. ஆனால் இதை மட்டும் மனதில் பச்சை குத்திக் கொள்ளுங்கள், “கணினியுகம் என்றைக்குமே அழிந்து விடாது. கூடு விட்டுக் கூடுபாயும் நுட்பம் போல ஒரு தொழில்நுட்பத்திலிருந்து இன்னொரு தொழில்நுட்பம் நோக்கி அது பாய்ந்து கொண்டே இருக்கும்” அவ்வளவு தான் வித்தியாசம்.

உதாரணமாக கணினி முதலில் வந்தபோது அது டைப் செய்யவும், தகவல்களை டிஜிடலாய் சேமிக்கவும் தான் பயன்பட்டது. பின்னர் ஒரு அலுவலகத்தை டிஜிடல் மயமாக்க உதவியது. அது பின்னர் உலக வலையுடன் இணைந்து வலைத்தளங்களின் வளர்ச்சிக்கு அடிகோலியது. பின்னர் வங்கிகளையும், நிறுவனங்களையும் இணைத்தது. பின்னர் மொபைல் தொழில்நுட்பத்துக்குத் தாவியது. வலைத்தளங்களை விட்டு விட்டு ஆப்களை தயாரிக்க நிறுவனங்கள் களமிறங்கின. இப்போது மொபைல்களையும் தாண்டி அணியும் தொழில்நுட்பத்தை நோக்கி நுட்பம் நாலுகால் பாய்ச்சலில் ஓடுகிறது.

ஆர்டிபிஷியல் இன்டலிஜென்ட் எனப்படும் செயற்கை அறிவு தொழில்நுட்பம் இன்றைக்கு மிகப்பிரபலம். கருவிகள் தாங்களாகவே முடிவெடுத்துச் செயல்படும் வகையில் வடிவமைக்கப்படுகின்றன. அத்துடன் மெஷின் லேர்ணிங் தொழில்நுட்பம் இணைந்துவிட்டது. சமீப காலமாக தொழில்நுட்ப உலகை ஆக்கிரமித்திருக்கும் பிக்டேட்டா, கிளவுட் கம்ப்யூட்டிங், ஆகுமென்டட் ரியாலிடி, இன்டர்நெட் ஆஃப் திங்க்ஸ் பிளாக் செயின் போன்றவையெல்லாம் கைகோர்த்து இணைந்து பயணிக்கின்றன.

ஜிம்மி… போய் பேப்பர் எடுத்துட்டு வா என்றது பழைய காலம். “அலெக்ஸா.. இன்னிக்கு என்ன நியூஸ்” என கேட்பது இந்தக் காலம். வீட்டின் வரவேற்பறைகளில் ஜம்மென அமர்ந்திருக்கும் கூகிள் ஹோம்களோ, அமேசான் அலெக்ஸாக்களோ நாம் கேட்கும் கேள்விகளுக்கெல்லாம் அட்சர சுத்தமாய்ப் பதில் சொல்கின்றன. நமக்குத் தேவையான உதவிகளைச் செய்கின்றன. ஆலோசனைகளைச் சொல்கின்றன. இனிமையான பாடலை இசைத்து மனதை இலகுவாக்குகின்றன.

தொழில்நுட்ப உலகம் நம்மை கணினியின் கரங்களில் ஒப்படைத்து விட்டது. கணினியையும், டிஜிடலையும் அவரச அவரசமாய் அரவணைத்துக் கொள்ளும் இந்த சூழலில் நாம் செய்ய வேண்டிய முக்கியமான இரண்டு விஷயங்கள் உண்டு.

ஒன்று, உறவுகளையும் நேசத்தையும் என்றும் டிஜிடல் இழைகளில் கட்ட முடியாது. நேரடியான உரையாடலையும், அன்பின் சந்திப்புகளையும், கரம் கோர்த்த ஆறுதலையும் எந்த கணினியும் இடம் பெயரச் செய்ய முடியாது. அத்தகைய மனிதத்தின் மதிப்பீடுகளை கணினியின் கரங்களுக்கு விற்று விடாதிருப்போம்

இரண்டு, இந்த டிஜிடல் வெளி ஆபத்துகளை உள்ளடக்கியது. எல்லாமே மறைந்திருப்பதைப் போலத் தோற்றமளிக்கும். ஆனால் வெளிப்படையாய் விழித்திருக்கும். இதில் நமது ரகசியத் தகவல்களையோ, படங்களையோ, செய்திகளையோ பகிராதிருப்போம். வெறுப்பின் உரையாடல்களையோ, வன்மத்தின் விவாதங்களையோ செய்யாதிருப்போம்.

இன்று உலகக் கணினி கல்வி தினம். கணினியை கல்வியாய்க் கற்போம், அன்பை உயிருக்குள் வைப்போம்.

*

சேவியர்.

daily thanthi

Advertisements

பேட்ட விமர்சனம்

Image result for petta

கெட்ட பயலா இருந்த காளி, பேட்ட பயலா உருமாறிய படம் பேட்ட !

ரஜினி படத்துக்கு கதை கேக்கறதும், சூரியனுக்கு நிலக்கரியை ஏற்றுமதி செய்றதும் தேவையற்ற சங்கதிகள். ரஜினி படத்தின் வெற்றி தோல்வியை கதைகளை விட, சொல்லும் விதமே நிர்ணயிக்கிறது. உடனே முள்ளும் மலரும், ஆறிலிருந்து அறுபது வரைன்னு பேச ஆரம்பிக்காதீங்க, சில விதி விலக்குகள் உண்டு.

ரஜினியின் வெற்றிப்படங்களைக் கூட்டிக் கழித்து அலசிப் பார்த்தால் ‘பழிவாங்குடா’ எனும் ஒற்றை வரியில் அடங்கிவிடுபவை தான் பெரும்பாலானவை. அதை எப்படி திரைக்கதையாக்கியிருக்கிறார்கள். எப்படியெல்லாம் ரஜினியிசத்தை அள்ளித் தெளித்திருக்கிறார்கள் என்பதை வைத்தே படம் பாக்ஸ் ஆபீஸில் நிலைப்பதா, பாக்ஸ்லேயே நிலைப்பதா என்பது முடிவாகிறது.

அந்த வகையில் ரஜினியின் அத்தனை பலங்களையும் ஒவ்வொன்றாய் எடுத்து, பிரேமுக்கு பிரேம் அலங்காரப்படுத்தியிருக்கும் படம் தான் பேட்ட.

“வயசானாலும் உன் அழகும் இளமையும் இன்னும் போகல” என படையப்பாவில் ரம்யா கிருஷ்ணன் பில்டப் கொடுப்பார். அந்த படம் வந்தே இருபது வருடங்கள் ஆகி விட்டது. அந்த வசனத்தை இந்தப் படத்திலும் பயன்படுத்தலாம் எனுமளவுக்கு, மேக்கப்பும், ஆடைகளும் கேமராவும் ரஜினியை அழகுபடுத்தியிருக்கின்றன.

அட இந்த சீன் பாஷா மாதிரி, அட இது நல்லவனுக்கு நல்லவன் ஸ்டைல், ஆஹா இது தளபதி காட்சி என ரசிகர்கள் காட்சிக்குக் காட்சி சிலாகிக்கிறார்கள். பழைய படங்களையெல்லாம் நினைவுபடுத்தி இதை ஒரு திருவிழா மாதிரி கொண்டாடுகிறார்கள். அது தான் இந்தப் படத்தின் வெற்றி.

அனிருத்தின் இசை கூட ரஜினியின் பிரபல பின்னணி இசைகளின் கோர்வையாய் இருப்பது ஒரு தனி ரசனை. அதை தனது ஸ்பெஷல் முத்திரைகளுடிடன் கலந்து கொடுத்திருக்கிறார். பொதுவாக அனிருத் இசையை ம்யூட் போட்டுக் கேட்டால் கூட காதில் இரத்தம் வடியும். இதில் அந்த சத்தங்களில் சண்டை இல்லாமல் இருப்பது ஒரு ஆறுதல்.

கதாபாத்திரமாகவே மாறிவிடும் விஜய் சேதுபதியின் உடல் மொழியும் நடிப்பும் ஆஹா ரகம் என்றால், வெறும் கண்களாலேயே நடித்து முடித்து விடும் நவாசுதீன் சித்திக் ஆஹாஹா ரகம். ஆனால் பெரிய வாழையிலையில் வைத்த ஒரு தேக்கரண்டி பிரியாணி போல அவர்களுடைய பார்ட் சட்டென முடிந்து விடுகிறது.

என்ன தான் இருந்தாலும் அந்த அக்மார்க் மதுரைக்கார பாம்படப் பாட்டியின் வீட்டில் மகேந்திரனின் ஒரு மகனாக நவாசுதீனையும் இன்னொரு மகனாக அருவா ஆறுமுக மீசையையும் பார்ப்பது உறுத்துகிறது. மகளின் முகத்திலும் மதுரை சாயல் இல்லை. சரி, குடும்பத்துல எதுக்கு பிரச்சினை கிளப்பிகிட்டு… வேண்டாம் விட்டுடுவோம்.

ஓ.. சொல்ல மறந்து விட்டேன் சிம்ரன், திரிஷா இருவரையும் பார்த்த ஞாபகம். அட, சசிகுமாரைக் கூட பார்த்தேனே, ஓ பாபி சிம்ஹா கூட வந்தாரே.. இப்படித் தான் மற்ற கதாபாத்திரங்களைப் பற்றி சொல்ல வேண்டியிருக்கிறது. காளியை திரையுலகில் அறிமுகப் படுத்திய மகேந்திரனையே ரெண்டு காட்சியோடு மட்டையாக்கியிருக்கிறார் சுப்புராஜ்ன்னா பாத்துக்கோங்க.

தொன்னூறுகளில் ஒட்டப்படும் போஸ்டர்களில் கடைசியில் ஒரு வரி சேர்ப்பார்கள். “பாட்டு பைட்டு சூப்பர்”. அதை இதிலும் சேர்க்கலாம், ரசிக்க வைக்கிறார்கள்.

ரஜினிக்கு வயசாயிடுச்சு, அந்த நிஜத்தை ஒத்துக் கொள்ள வேண்டும். அதை முடிந்தவரை ஸ்டைலாக‌ மாற்ற கேமரா கோணங்களையும், அரையிருட்டுக் காட்சிகளையும், மெல்லிய புகைமண்டலப் போர்வைகளையும் பயன்படுத்தியிருப்பது சிறப்பு, மிகச் சிறப்பு.

முதல் பாதி அழகான இயற்கைக் காட்சிகளுடனும், சுவாரஸ்யங்களுடனும், பில்டப்களுடனும் பிரமாதப்படுத்துகிறது. பாஷாவைப் போல ! இரண்டாவது பாதி, அந்த பாஷாவின் பில்டப்பை ஈடு செய்யவில்லை என்பது தான் நிஜம். ஆனாலும் பரபரக்கிறது. ஒருவகையில் இரண்டு வில்லன் குரூப், இரண்டு கதைக் களம் என கடைசியில் இரண்டு ரஜினி படங்கள் பார்த்த உணர்வு எழுவதையும் தவிர்க்க முடியவில்லை.

இது எதிர்பார்த்த டுவிஸ்ட் தான் என சினிமா ஜாம்பவான்கள் சொல்லிக் கொண்டிருக்கும் போதே, ‘அட இது நம்ம லிஸ்ட்லயே இல்லையே’ என இன்னொரு டுவிஸ்ட் கொடுத்து பீட்ஸா பரந்தாமன் கார்த்திக் சுப்புராஜ் வியக்க வைக்கிறார்.

ஆங்காங்கே வைத்திருக்கும அரசியல் பொடிகள் விசிலடிப்பவர்களுக்கானது. ஒவ்வொரு காட்சியையும் ரஜினியின் அறிமுகக் காட்சியைப் போல செதுக்கியிருப்பது இயக்குனரின் உள்ளே ஒளிந்திருக்கும் ரஜினி ரசிகருக்கானது. நாடி நரம்பு ரத்தம் சதை எல்லாத்துலயும் ரஜினி வெறி ஊறிப்போன ஒருவனிடமிருந்து வழிந்த ஒரு படம் இது.

காலா படத்தின் ஆழமான சமூகப் பார்வையை இதில் பார்க்க முடியாது. ஆனால் ரஜினியிடம் ரசிகர்கள் எதை எதிர்பார்க்கிறார்களோ அதை இதில் நிச்சயம் பார்க்கலாம்.

போரை முடிவுக்குக் கொண்டு வந்து விட்டு மீண்டும் ரஜினி திரையை தேர்ந்தெடுக்கலாம். வெற்றி சர்வ நிச்சயம் என்பது இந்தப் படம் ரஜினிக்குச் சொல்லும் பாடம்.

சுருக்கமாக, இது ரஜினி 2.0

*
சேவியர்
Xavi.wordpress.com

Article : உனக்கு நீயே நீதிபதி.

Image result for man thinking

சொர்க்கத்தில் நுழைவதற்காக கடவுளின் முன்னால் எல்லோரும் வந்து நிற்கின்றனர். அப்போது ஒரு அறிவிப்பு வருகிறது. “சொர்க்கத்தில் உள்ள சட்டதிட்டங்களில் ஒரு சின்ன மாறுதல். அதன் படி பாலியல் குற்றம் என்பது குற்றப்பட்டியலில் இருந்து நீக்கப்படுகிறது. பூமியில் பாலியல் குற்றம் செய்தவர்களும் சுவர்க்கத்தில் நுழையலாம்”

அறிவிப்பைக் கேட்டவுடன் கூட்டத்தில் நின்றிருந்தவர்களில் பாதி பேர் , “அட… சே.. நல்ல வாய்ப்பை வீணடிச்சுட்டோமே” என மனதில் நினைத்தார்கள். உடனே அடுத்த அறிவிப்பு வந்தது.

“வாய்ப்பை மிஸ் பண்ணிட்டோமே என நினைத்தவர்களெல்லாம் நரகத்துக்கும், மற்றவர்களெல்லாம் சொர்க்கத்துக்கும் வரலாம் “

வேடிக்கையாகச் சொல்லப்பட்ட கதையாக இருந்தாலும் இது சொல்ல வருகின்ற அடிப்படைக் கருத்து என்னவென்றால், “நமது மனதை நாமே வகைப்படுத்தாவிடில் அதனால் பயனில்லை” என்பது தான். வேர்களைக் கவனிக்காவிடில் கனிகள் சுவையாக இருக்காது என்பது தான்.

வெளிப்புறமான சட்டங்களோ, திட்டங்களோ, கட்டாயங்களோ, கண்டிப்புகளோ கொண்டு வருகின்ற மாற்றமானது உள்ளார்ந்த மாற்றத்தை உருவாக்குவதில்லை. மாற்றம் என்பது உள்ளில் உருவாகி வெளிப்படும் போது தான் அது மிகுந்த கனிகொடுக்கின்ற வாழ்க்கையை நமக்குத் தருகிறது.

நமக்கு நியாயமாகத் தீர்ப்பு வழங்கக்கூடியவர்கள் இரண்டே இரண்டு பேர் தான். ஒன்று கடவுள், இன்னொன்று நாம். காரணம், பிறர் நம்மை கணிப்பது நமது வெளிப்படையான செயல்களை வைத்துத் தான். ஆனால் நமக்கு மட்டுமே தெரியும் நமது உள்ளார்ந்த சிந்தனைகள்.

ஒருவரை நோக்கிப் புரிகின்ற புன்னகையை மொழிபெயர்த்தால் என்ன கிடைக்கும் என்பது நமக்கு மட்டுமே தெரியும். அதன் பின்னால் விகாரத்தின் கோரப் பற்கள் மறைந்திருக்கலாம். எரிச்சலின் எரிதழல் ஒளிந்திருக்கலாம். வெறுப்பின் குத்தீட்டிகள் குனிந்திருக்கலாம். பொறாமையின் புலி நகங்கள் புதைந்திருக்கலாம். அது நமக்கு மட்டுமே தெரியும். ஒரு புன்னகை புனிதமானது, அதன் பின்னணி புனிதமா என்பதை யாரும் அறிவதில்லை.

அல்லது நாம் ஒருவருக்கு உதவி செய்ய முன்வரலாம். அதன் பின்னால் மனிதத்தின் இழைகள் இருப்பதாகவே சமூகம் கருதிக் கொள்ளும். ஒருவேளை அதன் பின் நமது பெருமையின் வேர்கள் பற்றியிருக்கலாம். சுயநலத்தின் சன்னல்கள் திறந்திருக்கலாம். அல்லது கட்டாயத்தின் சட்டங்கள் கூட மறைந்திருக்கலாம். அதை அறிவது நாம் மட்டுமே.

இப்படி ஒவ்வொரு விஷயத்திலும் நம்மைப் பற்றிய தெளிவான குற்றப்பத்திரிகையை எழுத நம்மால் மட்டுமே முடியும். தெளிவான குற்றப்பத்திரிகைகளே நமது வாழ்வில் இருக்கின்ற குற்றங்களைக் குறித்த புரிதல்களை நமக்குத் தரும். குற்றங்கள் குறித்த தெளிவே அதை விலக்க வேண்டும் எனும் உந்துதலைத் தரும். அந்த உந்துதலே புனிதத்தை நோக்கிய நமது பயணத்தின் அடிப்படை விஷயம்.

தவறு செய்யவே வாய்ப்பில்லாத ஒரு இடத்தில் நேர்மையாளனாய் இருப்பதில் ஆச்சரியமில்லை. ஆனால் தவறு செய்ய அத்தனை வாய்ப்புகளும் கொட்டிக் கிடக்கின்ற ஒரு இடத்தில் நேர்மையாளராய் இருக்கிறீர்களா என்பதில் தான் நமது வாழ்க்கை அளவிடப்படுகிறது.

அது அலுவலக பேனாவை சொந்த வேலைக்காகப் பயன்படுத்துவதாய் இருந்தாலும் சரி, நேசித்த ஒருவரை உள்ளூர வெறுப்பதானாலும் சரி. சின்ன விஷயமோ, பெரிய விஷயமோ நமது மனமே நம்மை இயக்குகிறது.

மனம் எனும் குதிரைக்கு இடுகின்ற கடிவாளங்கள் வாழ்க்கை எனும் பயணத்தில் வெளிப்படுகின்றன. அந்த கடிவாளங்கள் நமது இயல்பிலிருந்து வெளிப்படும் போது வாழ்க்கை இனிமையாகிறது. அந்த கடிவாளங்கள் கட்டாயத்தின் கட்டுகளாகும் போது வாழ்க்கை வலிமிகுந்ததாகிறது.

நமது வாழ்க்கைக்கு நாமே நீதிபதியாக இருக்க வேண்டும். நம்மை வனையும் குயவனாக நாமே இருக்க வேண்டும். நம்மைச் செதுக்கும் சிற்பியாக நாமே இருக்க வேண்டும். அப்போது தான் நமது வாழ்க்கை அர்த்தமுடையதாகும்.

நமக்கு நாமே நீதிபதியாக இருக்கும்போது, சட்டங்கள் இல்லாவிட்டாலும் நேர்மையாக வாழவேண்டுமெனும் உந்துதல் இருக்கும். யாரும் பார்க்காவிட்டாலும் நம்மை நாமே பார்த்துக் கொள்கிறோம் எனும் எச்சரிக்கை உணர்வு இருக்கும். நமது தவறுகளுக்கான தண்டனையை நாமே பெற்றுக் கொள்ளவேண்டும் எனும் தார்மீக சிந்தனை இருக்கும்.

நமக்கு நாமே நீதிபதியாகும் போது, பிறருக்கு எதிராக நாம் தீர்ப்புகளை எழுத மாட்டோம். அவர்களுக்கு எதிராக அவர்களே வாதிடுவார்கள், தீர்ப்பிடுவார்கள். பிறருடைய வாழ்க்கையில் தேவையற்ற தலையீடுகளைச் செய்யாமல் இருக்கும் போது சமூக பிணைப்பு வலுவடையும்.

ஒவ்வொரு மரமும் செழிப்பாக இருக்கும்போது கானகம் செழிப்பாக இருக்கும். ஒவ்வொரு துளியும் புனிதமாக இருக்கும் போது நதியின் மொத்தமும் தூய்மையாக இருக்கும். ஒவ்வொரு மனிதரும் தன்னைத் தானே செதுக்கும் போது சமூகம் வலிமையாய் இருக்கும்.

நமது பலவீனங்களை மன்னிக்கும் நீதிபதியாக நாம் மாறும் போது, பலவீனங்களை பலங்களாய் மாற்றும் வாய்ப்புகள் கிடைக்கும். நமது பலங்களை நாமே பாராட்டிக் கொள்ளும் போது நமது பலங்களை பயன்களாக மாற்றிக் கொள்ளும் உறுதி உருவாகும். நமது குறைகளை நாமே செதுக்கும் போது நமது வாழ்க்கை அர்த்தம் பெறும்.

ஆனால் ஒன்று, நமக்கு நாமே நீதிபதியாய் மாறுவது, நமது தவறுகளுக்கு அனுமதி வழங்க அல்ல, நமது பிழைகளுக்கு அங்கீகாரம் கொடுக்க அல்ல, நமது குற்றங்களை கண்டுகொள்ளாமல் இருக்க அல்ல. நம்மை நாமே சீர்தூக்கிப் பார்த்து சரிசெய்ய.

ஒவ்வொரு நாளும் நமது செயல்களை நமக்கு முன்னால் கொண்டு நிறுத்தி வாதியாகவும், பிரதிவாதியாகவும் நாமே வாதிடுவோம். அந்த வாதம் நேர்மையாய் இருக்கட்டும். அப்போது நமது பிழைகளும், நமது நல்ல செயல்களும் நமக்கே புரியவரும். அதற்கான தீர்ப்பை நாமே எழுதுவோம்.

நம்மை நாமே சரியாகத் தீர்ப்பிடும்போது சமூகம் நம்மை தவறாகத் தீர்ப்பிடுவதில்லை. நம்மை நாமே திருத்திக் கொள்ளும் போது சமூகம் நம்மை உடைப்பதில்லை. அந்த பணியை நாம் கைக்கொள்ள வேண்டும்.

நமக்கு நாமே நீதிபதியானால்
பிறருக்கு நாம் குற்றவாளியாவதில்லை.

*

Data Science 8 : தகவல் அறிவியல் 8

எதிர்காலத்தில் தகவல் அறிவியல்

Image result for data science

எந்த ஒரு தொழில்நுட்பமும் கல்வெட்டு போல நிலைத்து நிற்பதில்லை. நாட்கள் செல்லச் செல்ல அந்த நுட்பம் தனது முக்கியத்துவம் இழந்து விடுகிறது. அப்போது இன்னொரு தொழில்நுட்பம் அந்த இடத்தை ஆக்கிரமித்துக்  கொள்ளும். அதுவும் இன்றைய டிஜிடல் யுகத்தில் தொழில்நுட்பத்தின் மாற்றங்கள் எக்ஸ்பிரஸ் வேகத்தில் தான் நிகழ்கின்றன.

தகவல் அறிவியல் தொழில்நுட்பமும் அப்படித் தான் இன்று இருப்பதைப் போலவே எல்லா நாளும் இருக்கப் போவதில்லை. மாற்றங்களை நிச்சயமாகச் சந்திக்கப் போகிறது, புதிய புதிய வடிவங்களை எடுக்கப் போகிறது. புதிய புதிய தொழில்நுட்பங்களோடு தன்னை இணைத்துக் கொள்ளப் போகிறது.

ஆர்டிஃபிஷியல் இன்டலிஜென்ஸ் எனப்படும் செயற்கை அறிவு அதில் முக்கியமான ஒன்று. அது கண்டிப்பாக இன்னும் ஆழமாக தகவல் அறிவியல் துறைக்குள் நுழையும் என்பதில் சந்தேகமில்லை. அப்போது அல்காரிதங்களும், மென்பொருட்களும் தன்னிலே “ஸ்மார்ட்” ஆக மாறி தகவல்களை பயன்படுத்தத் துவங்கிவிடும். மனித உதவி தேவையில்லாமலேயே பின்னர் ‘பிரடிக்டிவ்’ அலசல்கள் நடக்க வாய்ப்புகள் அதிகம்.

ஆர்டிபிஷியல் இன்டெலிஜென்டின் வரவு தகவல் அறிவியலில் ஏற்படுத்துகின்ற விளைவுகளில் ஒரு எதிர் விளைவும் உண்டு. எப்போது செயற்கை அறிவு முழுமையாக தகவல் அறிவியலில் நுழைகிறதோ அப்போது மனித உழைப்புக்கு அங்கே வேலை குறைகிறது. ஆட்டோமேஷன் அந்த இடத்தை வந்தடைகிறது. இதனால் அந்த காலகட்டத்தில் வேலை வாய்ப்புகள் குறையும். ஆனால் அதுவரை தகவல் அறிவியலார்களுக்கான தேவை அதிகரித்துக் கொண்டே இருக்கும்.

அதே போல மெஷின் லேர்னிங் எனப்படும் தொழில்நுட்பமும் இன்னும் அதிகமாக தகவல் அறிவியலில் இணைந்து கொள்ளும். ஏற்கனவே மெஷின் லேர்னிங் நுட்பம் டேட்டா சயின்ஸோடு இணைந்து தான் பயணிக்கிறது. இனிமேல்  இன்னும் அதிகமாக அந்த பிணைப்பு இருக்கும்.

உதாரணமாக ஒரு இயந்திரம் தனது தகவலை இன்னொரு இயந்திரத்துக்கு தானாகவே அனுப்பும், ஒரு கருவி வேறு பல கருவிகளிலிருந்து வருகின்ற தகவல்களை தானாகவே சேகரித்து அலசலை துவங்கும். சென்சார்களின் தகவல்கள் அங்கும் இங்கும் தானாகவே கூடு விட்டுக் கூடு பாய்ந்து தனது பணிகளைச் செய்யும். என இந்த மெஷின் லேர்னிங் நுட்பம் தகவல் அறிவியலில் வெகு ஆழமாய் செல்லும் என்பதில் சந்தேகமே இல்லை.

மருத்துவத் துறையில் தகவல் அறிவியலின் பயன் இன்னும் பல மடங்கு அதிகரிக்கப் போகிறது. குறிப்பாக நியூரல் நெட்வர்க் எனும் நரம்பியல் துறையில் தகவல் அறிவியலின் பயன்பாடு வெகுவாக அதிகரிக்கும் என மருத்துவ அறிக்கைகளும், ஆய்வுகளும் தெரிவிக்கின்றன.  மருத்துவம் ஏற்கனவே தகவல் அறிவியலை ஆய்வுகளிலும், மருத்துவமனைகளிலும் பயன்படுத்தி வருகிறது. அது இன்னும் பலமடங்கு அதிகரிக்கும்.

இன்டர்நெட் ஆஃப் திங்க்ஸ் எனும் தொழில்நுட்பம் பற்றி கேள்விப்பட்டிருப்பீர்கள். இப்போது கணினி துறையில் படிப்பவர்களுக்கு இது ஒரு கட்டாயப் பாடமாகவும் இருக்கிறது. எப்படி இணையத்தில் தகவல்களை சேமிக்கிறோமோ, அப்படி உலகில் நாம் பயன்படுத்தும் பல்வேறு பொருட்களையும் இணையத்தோடு இணைப்பது தான் இதன் அடிப்படை சிந்தனை. உதாரணமாக உங்கள் வீட்டு கேஸ் ஸடவ்வை நீங்கள் இணையத்தோடு இணைக்கலாம். அது ஒழுங்காக வேலை செய்கிறதா என்பதைக் கவனிக்கலாம்.

இவற்றையெல்லாம் சென்சார்கள் கவனித்துக் கொள்கின்றன. டிஜிடல் தகவல்களை அவை கணினிகளுக்கோ, அல்லது அது போன்ற கருவிகளுக்கோ அனுப்பி இணைய உலகோடுள்ள உறவை உயிர்ப்பித்துக் கொள்கின்றன. இன்றைக்கு சுமார் 170 பில்லியன் எனுமளவில் இருக்கும் இன்டர்நெட் ஆஃப் திங்க்ஸ் பிஸினஸ் இன்னும் நான்கு ஆண்டுகளில் சுமார் 560 பில்லியன் எனுமளவுக்கு எகிறும் என்கின்றன ஆய்வுகள்.

அதே போல பிக் டேட்டா எனும் தொழில்நுட்பமும் தகவல் அறிவியலின் ஒரு பாகம் தான். பிக் டேட்டா என்பது உங்களுக்குத்  தெரிந்த விஷயம் தான். கொட்டிக் கிடக்கின்ற கணக்கற்ற தகவல்களை எப்படி பயனுள்ள தகவல்களாக மாற்றுகிறோம் ? எப்படி அவற்றைக் கொண்டு தொழிலை வளர்ச்சிப் பாதையில் அழைத்துச் செல்கிறோம் என்பது தான் அதன் அடிப்படை. முழுக்க முழுக்க தகவல்களின் அடிப்படையில் இயங்குவதால் இது தொடர்ந்து தகவல் அறிவியலில் ஒரு முக்கியமான பாகமாக இருக்கும் !

வெறும் எண்களையும், டிஜிடல் எழுத்துகளையும் வைத்து தான் இன்றைக்கு தகவல் அறிவியல் அசத்திக் கொண்டிருக்கிறது. மற்றெந்த வகை தகவல்களாய் இருந்தாலும் அவற்றை முதலில் டிஜிடல் எண்களாகவோ, எழுத்துகளாகவோ மாற்றினால் தான் பயன்பாட்டுக்குக் கொண்டு வர முடியும் எனும் சூழல் இருக்கிறது. இந்த நிலை மாறும் !  இனி வரும் காலங்களில் தகவல்களை டிஜிடல் எண்களாக மாற்றாமல் நேரடியாகவே பயன்படுத்தக் கூடிய நுட்பங்கள் உருவாகும்.

அப்படிப்பட்ட மாற்றம் வரும்போது தகவல் அறிவியலில் இன்னும் வியப்பூட்டும் விஷயங்கள் நடக்கும். ஆடியோக்கள், வீடியோக்கள், புகைப்படங்கள், லைவ் கேமராக்கள் போன்றவை எல்லாமே மிகப்பெரிய நேரடியான உள்ளீடு தகவல்களாக பயன்படும். தகவல் அறிவியலின் மிகப்பெரிய புரட்சி அது என சொல்லலாம்.

அத்துடன் ‘நேட்டிவ் லேங்குவேஜ்’ எனப்படும் மொழிகடந்த தகவல் அறிவியலும் உருவாகிவிட்டால் இதன் வீச்சு கணிக்க முடியாத அளவுக்கு இருக்கும்.

ஹைப்பர் பெர்சனலைசேஷன் எனப்படும் தனிமனிதனை மையப்படுத்தி செய்கின்ற தொழில்களுக்கு தகவல் அறிவியல் தான் மிகப்பெரிய துணையாய் இருக்கப் போகிறது. விற்பனையாளருக்கும், வாடிக்கையாளருக்கும் இடையேயான தொடர்பை இறுக்கிப் பிடித்து விற்பனையை உறுதி செய்வதில் இந்த பெர்சனலைசேஷன் சிந்தனை தேவையானதாய் இருக்கிறது.

ஆகுமென்டட் ரியாலிடி எனும் தொழில்நுட்பத்தில் ஏற்படுகின்ற மாற்றங்களும் தகவல் அறிவியலின் வளர்ச்சியைக் கொண்டு வரும். ஆகுமென்டர் ரியாலிடி இன்றைக்கு ‘கேம்ஸ்’ துறையில் கொண்டு வந்திருக்கின்ற மாற்றங்கள் எக்கச்சக்கம். அப்படியே அந்த நுட்பத்தை ஸ்மார்ட் போனில் மாற்றுகின்ற நடைமுறையும் இப்போது வரத் துவங்கியிருக்கிறது. ஆகுமென்டட் ரியாலிடி வளர வளர, டேட்டா சயின்ஸும் வளரும்.

பிகேவியரல் அனாலிசிஸ் எனப்படும், ஒரு மனிதனுடைய குணாதிசயங்களை அலசுகின்ற, உளவியல் சார்ந்த தகவல் அறிவியலும் இப்போது வளர்ந்து வருகிறது. பயனாளர்களை உளவியல் ரீதியாக அணுகும் முறை இது என்றும் சொல்லலாம். எந்த அளவுக்கு ஒரு நபரைத் தெரிந்து வைத்திருக்கிறோமோ, அந்த அளவுக்கு அவருடைய தேவைகளை அறிந்து கொள்ள முடியும் எனும் அடிப்படை விஷயம் தான் இங்கே கையாளப்படுகிறது.

தகவல் அறிவியலில் வளர்ச்சியும், ஆர்டிபிஷியல் இன்டெலிஜென்ட் வளர்ச்சியும் இயந்திரங்களையும், கருவிகளையும் ஸ்மார்ட் ஆக மாற்றிக் கொண்டிருக்கின்றன. இனிமேல் அந்த கருவிகளெல்லாம் அறிவைத் தாண்டி ஞானம் உடையவையாக மாறும் என்பதே தொழில்நுட்பம் தருகின்ற தொலை நோக்குப் பார்வை. நமது பிள்ளைகளுக்கு நாம் அறிவைக் கொடுக்கும் முன்பே நல்ல சிந்தனைகளையும், பகுத்தறிவையும் கொடுக்கிறோம் இல்லையா ? அதே போல நமது  இயந்திரங்களும் ஞானம் கொண்டவையாய், சுய சிந்தனை கொண்டவையாய் மாறும் என்பதே தகவல் அறிவியலின் சிந்தனை.

சுருக்கமாகச் சொல்லவேண்டுமெனில், தகவல் அறிவியலின் வீச்சும் பயன்பாடும் அடுத்த ஐந்து பத்து ஆண்டுகளுக்கு நிற்கப் போவதில்லை. வடிவம் மாறி, நுட்பம் மாறி பயணித்துக் கொண்டே தான் இருக்கப் போகிறது. எனவே ஆர்வமும், திறமையும் உடையவர்கள் தயங்காமல் இந்தத் துறையை அரவணைத்துக் கொள்ளலாம்

( முற்றும் )

Data Science 7 :

Image result for data science

 

அமெரிக்காவுக்கு மட்டுமே இந்த ஆண்டு இறுதிக்குள் இரண்டு இலட்சம் டேட்டா சயின்ஸ் பொறியாளர்கள் தேவைப்படுவார்கள் என்கிறது மெக்கன்சி ஆய்வு. அடுத்த பத்து ஆண்டுகளுக்கு தொழில் நுட்ப உலகை வசீகரிக்கப் போகும் வேலை இந்த தகவல் அறிவியல் தான் கூகிள் நிறுவன தலைமை பொருளாதார அதிகாரி ஹான் வாரியன். தகவல் அறிவியல் எனும் துறை இப்போதே பெரும்பாலான நிறுவனங்களின் முதுகெலும்பாகத் தான் இருக்கிறது. அப்படி வசீகரிக்கும் நிறுவனங்களில் மூன்று நிறுவனங்களைப் பற்றி நாம் கடைசியில் பார்ப்போம் !

‘இந்த தகவலை எல்லாம் வெச்சு என்ன செய்ய போறோம்” என்கிற மனநிலை ஒரு காலத்தில் இருந்தது. இப்போது அது தலைகீழாக மாறிவிட்டது. எந்த தகவலை வைத்தும் என்ன வேண்டுமானாலும் செய்யலாம் எனும் சிந்தனை உருவாகிவிட்டது. தகவல் என்பது பொன்முட்டையிடும் வாத்தாக மாறிவிட்டது. தகவல் என்பது பணம் காய்க்கும் மரமாகிவிட்டது. அதனால் தான் எல்லா மென்பொருட்களும், நிறுவனங்களும் தகவல் சேகரிப்பில் ஆர்வம் காட்டுகின்றன. அது பல வேளைகளில் தனி மனித சுதந்திரத்துக்கு வேட்டு வைப்பதாகவும் அமைந்து விடுகிறது என்பது தனிக்கதை.

எனவே இப்போதெல்லாம் நிறுவனங்கள் தங்கள் அடிப்படை சிந்தனையாக எழுதிக் கொள்ளும் விஷயம் இது தான், “தகவல்கள் எல்லாமே ஏதோ ஒரு வகையில் தேவையானவை”. ஒரு தகவலை சாதாரணமான ஒரு எண்ணாகவோ, எழுத்தாகவோ பார்க்காமல் அதன் பின்னணியில் இயங்குகின்ற விஷயங்களை ஊகித்து அறிவதிலும், கணித்து கண்டுபிடிப்பதிலும் இருக்கிறது தகவல் அறிவியலின் முதல் வெற்றி.

தகவல்களுக்கு எடை உண்டு ! தகவல்கள் காற்றைப் போல அங்கும் இங்கும் அலைந்து திரிந்தாலும் அதை சரியான வகையில் கட்டுப்படுத்தி கட்டி வைப்பவர்களுக்கு அது செல்வத்தை அள்ளித் தருகிறது. காற்றிலிருந்தும் தகவலை சேகரிப்பது தகவல் அறிவியலின் தேவை. அதாவது, யாருக்கும் தேவையில்லை என நினைக்கும் விஷயங்கள் ஒரு நிறுவனத்தின் வளர்ச்சியையே ஒட்டு மொத்தமாய்ப் புரட்டிப் போட முடியும்.

இப்போது இன்னொரு சிந்தனை வேண்டும். “நம்மிடம் இருக்கின்ற பிரச்சினை இன்னது.. இதை எப்படி நம்மிடம் இருக்கின்ற தகவலோடு இணைத்து முடிச்சுப் போடுவது ? இதற்குத் தான் மென்பொருட்களும், அல்காரிதங்களும் உதவிக்கு வருகின்றன. ஆனால் ஒரு சாதாரண நபராக ஒரு பிரச்சினையையும், அதை எப்படி இந்தத் தகவல் தீர்த்து வைக்கலாம் எனும் சிந்தனையும் இருக்க வேண்டியது அவசியம்.

இப்போது அடுத்த நிலை ! தகவலைப் புரிந்து கொண்டாயிற்று. அதை எப்படி பிரச்சினையோடு இணைத்து முடிவை நோக்கி நகர்வது என்பதையும் அறிந்தாயிற்று. அதைச் செயல்படுத்தக்கூடிய கட்டமைப்பு நிறுவனத்துக்கு இருக்கிறதா ? என்பதைப் பார்க்க வேண்டும். வண்டி நுழையாத தெருவுக்குள் வீட்டை கட்டி வைத்தால், பென்ஸ் கார் வாங்கினாலும் பயனில்லை அல்லவா ? எனவே செயல்படுத்தப் பட வேண்டிய கட்டமைப்பை உருவாக்குவதும், சரியான நேரத்தில் அதை செயல்படுத்துவதும் அவசியம்.

எதிர்காலத்தில் இந்த தகவல் அறிவியல் என்பது , ‘ரியல் டைம் டேட்டா’ அதாவது தகவல்கள் வர வர அதை வைத்து ஆட்டோமெடிக்காக அலசி முடிவுகள் எடுக்கும் முறை வந்து விடும். இப்போதைக்கு இருக்கின்ற தகவல்களைக் குவித்து, அதை அலசி தான் முடிவுகளை எடுக்கிறோம். அதன் பின் வருகின்ற அதிகபடியான தகவல்கள் ஆட்டோமெடிக்காக பயன்படுத்தப்படும் சூழல் உருவாகும்.

இப்போது தகவல் அறிவியல் துறையில் கோலோச்சிக் கொண்டிருக்கும் டாப் 3 நிறுவனங்களைப் பற்றி பார்க்கலாம்.

1. கூகிள் !

நம்மை ரகசியக் கண் கொண்டு பார்த்துக் கொண்டே இருக்கும் நிறுவனம் என நீங்கள் கூகிளை சொல்லலாம். ஜிமெயிலில் நீங்கள் அனுப்புகின்ற ஒவ்வொரு மெயிலும் வாசிக்கப்படலாம், பிக் டேட்டா அனாலிசிஸ் செய்யப்படலாம், அந்தத் தகவல்களை பிஸினஸ் தேவைக்காய் பயன்படுத்தலாம்.

உதாரணமாக, நீங்கள் ஒரு விமான டிக்கெட் புக் செய்கிறீர்கள். அதை கூகிள் மெயிலுக்கு அனுப்புகிறீர்கள் என வைத்துக் கொள்ளுங்கள். அது அந்தத் தகவல்களையெல்லாம் படித்து விட்டு, அங்கே அந்த நாளில் உங்களுக்கு ஹோட்டல் வேண்டுமா, கார் வேண்டுமா, வேறு ஏதாவது வசதிகள் வேண்டுமா என டிஜிடல் நச்சரிப்பை ஆரம்பிக்கும்.

எதற்கெடுத்தாலும் நாம் கூகிளைத் தான் அழைத்து, ‘தேடுதல்’ செய்கிறோம் இல்லையா ? அந்த தகவல்களெல்லாம் அவர்களுடைய சர்வரைக் கடந்து தான் செல்கின்றன. அவற்றில் எவையெல்லாம் தேவைப்படுமோ அவற்றையெல்லாம் கூகிள் சேமித்துக் கொள்கிறது. இன்னும் சொல்லப்போனால், தனது நிறுவனத்தில் பணிசெய்யும் ஊழியர்களுக்கு என்ன கொடுத்தால் குஷியாவார்கள் என்பதையும் இந்த தகவல் அறிவியல் கண்டறிந்து சொல்கிறது.

நீங்கள் யூடியூபில் பார்க்கின்ற வீடியோக்கள் அடிப்படையில் உங்களுக்கு புதிய வீடியோக்களை அறிமுகம் செய்கிறது. அதன்பின் இப்படிப்பட்ட வீடியோ பார்ப்பவர்கள் வேறென்ன பார்க்கலாம் என்பதைக் கணிக்கிறது. எத்தனை முறை பார்க்கிறார்கள் என்பதை வைத்து அவர்களை எடை போடுகிறது. எந்த நேரத்தில் எந்த வீடியோவைப் பார்ப்பவர்கள் என்ன குணாதிசயம் கொண்டவர்கள் என்பதை அல்காரிதம் மூலம் சேமிக்கிறது. அதன் அடிப்படையில் விளம்பரங்களோ, வசீகரங்களோ தந்து வலையில் வீழ்த்துகிறது.

2. அமேசான் !

அமேசான் நிறுவனத்தைப் பற்றி சொல்லவேண்டாம். ஆன்லைன் ஷாப்பிங் செய்த எல்லோருக்குமே அந்த அனுபவம் நிச்சயம் இருக்கும். ஒரு பொருளை வாங்க அந்தத் தளத்துக்குப் போனாலே உங்களை வரவேற்று உங்களுக்குத் தேவையானவற்றைத் தந்து உங்களை ஈர்த்துக் கொண்டே இருக்கும்.

உங்களுடைய தேடுதல் பேட்டர்ன், உங்களுடைய பர்சேஸ் பேட்டர்ன் போன்றவற்றையெல்லாம் வைத்து நீங்கள் ஒரு பொருளை வாங்குவீர்களா, மாட்டீர்களா என்பதை அது கணிக்கும். உங்களுடைய வாங்கும் திறமைக்குத் தக்க பொருட்களை மட்டுமே அது உங்களுக்கு பரிந்துரை செய்யும். மாருதி கார் வாங்கும் அளவுக்கு வசதி மட்டுமே உடையவர்களுக்கு அது ஆடி காரை பரிந்துரை செய்யாது. அந்த அளவுக்கு அதை அறிவுசார் மென்பொருளாய் மாறியிருக்கிறது. அதன் காரணஅது ம் ஆர்டிபிஷியல் இன்டலிஜென்ஸ் கலந்த பிக் டேட்டா என்பதில் சந்தேகமில்லை.

அது இன்னும் ஒரு படி மேலே போய், நீங்கள் ஒரு பொருளை வாங்குவீர்களா இல்லையா என்பதைக் கணித்து, வாங்குவீர்கள் என மென்பொருளின் அல்காரிதம் சொன்னால் அந்தப் பொருளை அடுத்திருக்கும் ஒரு கடைக்கோ, கோடவுனுக்கோ அது அனுப்பவும் செய்கிறது. இப்படி தனது வளர்ச்சியின் முதுகெலும்பாய் தகவல் அறிவியலைத் தான் கட்டி வைத்திருக்கிறது.

3, ஃபேஸ் புக் !

பேஸ்புக் தகவல் அறிவியலில் ஒரு மிகப்பெரிய உயரத்தை எட்டிய கம்பெனி. இந்த நிறுவனத்தின் பாசிடிவ் விஷயம் என்னவென்றால், அவர்களிடம் எக்கச்சக்க தகவல்கள் இருக்கின்றன என்பது தான். ஒன்றிரண்டு அல்ல, அவர்களிடம் சுமார் 220 கோடி பேருடைய தகவல்கள் இருக்கின்றன. எல்லாமே தனிப்பட்ட தகவல்கள். இவற்றை வைத்துக் கொண்டு உங்களுடைய தேவைகளையெல்லாம் அது அறிந்து கொள்ளும்.

அப்படியே உங்களோடு தொடர்பில் இருப்பவர்களைப் பார்த்து, யாரையெல்லாம் வசீகரிக்கலாம். என்னென்ன பொருட்களை விற்கலாம். என்பதையெல்லாம் கணக்கு போடும். விளம்பரங்களின் மூலம் மிகப்பெரிய லாபத்தை அடைகின்ற நிறுவனங்களில் ஒன்று பேஸ்புக் என்பதில் சந்தேகமேயில்லை.

இவையெல்லாம் நமக்குத் தெரிந்த பெரிய கம்பெனிகள். அதற்காக அவை மட்டும் தான் இந்த தகவல் அறிவியல் துறையில் கோலோச்சும் நிறுவனங்கள் என்பதில்லை. சின்னச் சின்ன நிறுவனங்கள் கூட தகவல் அறிவியலை தங்களுடைய பிஸினஸ் வளர்ச்சிக்குப் பயன்படுத்துகின்றன.

“சரி பண்றவன் பண்ணிட்டு போறான்”, என நிறுவனங்கள் அலட்சியமாய் இருந்து விடவும் முடியாது. பொம்மலாட்டக் குதிரையை ரேஸ் டிராக்கில் விட்டது போல ஆபத்தாகிவிடும். விரைவிலேயே பிஸினஸை மூட்டை கட்டி வைப்பதைத் தவிர வேறு வழி இல்லை என்றாகிவிடும்.

தகவல் அறிவியலின் சிந்தனை கொஞ்சம் பழையதாய் இருந்தாலும், இன்றைய தொழில்நுட்பம் அதை மிகப்பெரிய உயரத்துக்கு எடுத்துச் சென்றிருக்கிறது. அதனால் தான் இன்றைக்கு தகவல் அறிவியல் பொறியாளர்களின் தேவை முன்பெப்போதும் இல்லாத அளவுக்கு எகிறியிருக்கிறது.

Data Science 6 : தகவல் அறிவியல் 6

Image result for data science

தகவல் அறிவியல் என்றால் என்ன ? அதற்கு என்னென்ன அடிப்படைத் திறமைகள் இருக்க வேண்டும் ? யாரெல்லாம் தகவல் அறிவியல் துறையில் நுழையலாம். இதனால் தொழில்நுட்ப உலகில் நிகழ்கின்ற மாற்றங்கள் என்னென்ன ? எப்படிப்பட்ட வேலைகள் நமக்காகக் காத்திருக்கின்றன, போன்றவற்றையெல்லாம் கடந்த வாரங்களில் நாம் அலசினோம். இந்த வாரம் தகவல் அறிவியல் துறையில் கோலோச்சுகின்ற சில மென்பொருட்களைப் பற்றிப் பார்க்கலாம் !

தொழில்நுட்பத் துறையில் நுழைபவர்கள் முன்னால் எப்போதுமே ஆஜானுபாகுவாய் நிற்கும் ஒரு மிகப்பெரிய கேள்வி, “என்ன படிக்கலாம் ?” என்பது தான். பட்டப்டிப்பைப் பொறுத்தவரை எளிதில் நாம் ஒரு முடிவுக்கு வந்து விடலாம். அல்லது ஒரு நாலு பேரிடம் கேட்டால் ஒரு பொதுவான பதில் கிடைத்து விடும். அதை வைத்துக் கொண்டு நாம் ஒரு படிப்பைத் தேர்ந்தெடுக்கலாம்.

ஆனால் மென்பொருள் விஷயத்தில் அப்படி நடக்காது. நாலு பேர் என்ன ? நாற்பது பேரிடம் கேட்டால் நாற்பது விதமாகத் தான் சொல்லுவார்கள். அதில் எது சரியானது என்பதைக் கண்டுபிடிப்பது இடியாப்பச் சிக்கல் போன்றது. அதற்காக, உங்களுக்கு ஐடியா கொடுப்பவர்களைக் குறைசொல்கிறேன் என்பது பொருள் அல்ல ! ஒவ்வொருவரும் அவரவர் பார்வையில் எது தேவையானது என்பதைச் சொல்வார்கள் அவ்வளவு தான்.

எனவே பொதுவாக எவையெல்லாம் முக்கியமான மென்பொருட்கள் என்பதை அறிந்து கொள்வது தேவையான ஒன்று ! ஒன்றை நினைவில் வைத்துக் கொள்ளுங்கள். தகவல் அறிவியல் துறையில் நூற்றுக்கணக்கான மென்பொருட்கள் உள்ளன ! அனைத்தையும் படித்து அதில் எக்ஸ்பர்ட் ஆவது என்பது சாத்தியமில்லாத ஒன்று ! மட்டுமல்ல, தேவையில்லாத ஒன்றும் கூட ! எனவே சிலவற்றைத் தேர்ந்தெடுத்து அதை ஆழமாகப் படிப்பது மட்டுமே தேவையானது !

இந்தத் துறையில் முக்கியமாய் கோலோச்சுகின்ற மென்பொருட்கள் என்னென்ன என்பதை, தொழில்நுட்ப அடிப்படையிலும், பயன்பாட்டு அடிப்படையிலும், தேவையின் அடிபடையிலும் பார்ப்போம்.

ஒரு டாப் 10 மென்பொருட்கள் என தேர்ந்தெடுப்பது “டாப் 10 மூவீஸ்” போல அத்தனை எளிதல்ல. இருந்தாலும் இவை நிச்சயம் சிறப்பிடம் பிடிக்கக் கூடிய மென்பொருட்கள் என்பதில் சந்தேகமில்லை.

1. ஆர்

தகவல் அறிவியல் துறையில் எல்லோரும் கேள்விப்பட்டிருக்கக் கூடிய ஒரு மென்பொருள் ஆர் ! ஒரே ஒரு எழுத்துடைய மென்பொருள் என்பதால் மனதில் எளிதாய் தங்கும் ! ஸ்டாட்டிஸ்டிகல் கம்ப்யூட்டிங் எனப்படும் புள்ளிவிவரக் கணினியியலில் இந்த மென்பொருளின் பங்களிப்பு கணிசமானது.

வின்டோஸ், மேக், யுனிக்ஸ், லெனக்ஸ் என பல்வேறு தளங்களில் இது பயன்படுத்த முடியும் எனும் நிலையில் உள்ளது. சாஸ் போன்ற பிரபல மென்பொருட்களுக்கு மிகச்சிறந்த மாற்றாக தொழில்நுட்ப உலகில் கோலோச்சும் மென்பொருள்.

2. மேட்பிளாட்லிப்

தகவல்களை எப்படி வசீகரமாக, எளிதாகப் புரியும் வகையில் சொல்லலாம் என்பது மிக முக்கியம். அதற்கு மேட்பிளாட்லிப் ரொம்பவே கைகொடுக்கும். ஸ்டாட்டிஸ்டிக் அதாவது புள்ளி விவரங்களை வரைபடங்களாக மாற்றி வசீகரிக்க வைப்பதில் இது முக்கியத்துவம் பெறுகிறது.

மேட்லேப் போன்ற மென்பொருட்களின் மீது பரிச்சயம் உண்டென்றால் மேட்பிளாட்லிப்பைக் கற்றுக் கொள்வது, மிக எளிதான விஷயம். அல்லது அதே போன்ற வேறெந்த மென்பொருளைக் கற்றிருந்தாலும் இதை எளிதில் புரிந்து கொள்ளலாம்.

3. ரேப்பிட் மைனர்

இலவசமாகக் கிடைக்கின்ற ஓப்பன் சோர்ஸ் மென்பொருள் இது. தகவல் அறிவியலில் முடிவுகளை எடுப்பதற்கு இந்த மென்பொருள் உதவும். இதற்குள் மெஷின் லேர்னிங் அல்காரிதம்கள் இதற்குள் ஏற்கனவே தயாராய் இருக்கும். ஒருவகையில் கொஞ்சம் ரெடிமேட் மென்பொருள் இது.

ஏகப்பட்ட பைல் வகைகளை இது ஏற்றுக் கொள்ளும், முப்பதுக்கும் மேற்பட்ட வகையில் முடிவுகளை வெளிப்படுத்தும், என பல்வேறு வசீகர அம்சங்கள்

4. ஹடூப்

பிக் டேட்டா எனும் பெயர் கடந்த சில ஆண்டுகளாக தொழில்நுட்ப உலகை கலக்கிக் கொண்டிருந்தபோது பிரபலமானது இந்த ஹடூப். ஆறு ஆண்டுகளுக்கு முன்பே வெளியானாலும் கடந்த மூன்று நான்கு ஆண்டுகளாய் தான் பிரபலமானது.

தகவல் அறிவியலில் பிக்டேட்டாவின் பங்களிப்பும் அடக்கம். தகவல் அறிவியலின் ஒரு பாகம் தான் பிக்டேட்டா என்றும் சொல்லலாம். எனவே ஹடூப் தெரிந்திருப்பது டேட்டா சயின்ஸ் துறைக்கு ரொம்பவே பயன் தரும். அப்பாச்சி ஹடூப் பிரேம்வர்க் பற்றி நன்றாகப் புரிந்து கொள்வது பயனளிக்கும்.

5. டேப்லூ பப்ளிக்

டேட்டா விசுவலைசேஷன் எனப்படும் தகவலை கற்பனையில் விரித்துப் பார்ப்பது தகவல் அறிவியலில் மிக முக்கியமானது. அதற்கு பல்வேறு மென்பொருட்கள் உதவுகின்றன. அதில் முக்கியமான ஒரு மென்பொருள் இது.

மென்பொருள் துறையில் பரிச்சயம் இல்லாதவர்களும் இதை மிக எளிதில் கற்றுக் கொண்டு பயன்படுத்தலாம் என்பது இதிலுள்ள ஒரு சிறப்பம்சம். இதிலுள்ள ஒரு குறை என்னவென்றால், இதையும் மென்பொருள் ‘ஆர்” ஐயும் இணைக்க முடியாது என்பது தான். இரண்டுமே பிரபலமான மென்பொருட்கள் ! இரண்டையும் இணைக்கும் வகை இருந்திருந்தால் இன்னும் சிறப்பாக இருந்திருக்கும்.

6. ஓப்பன் ரிஃபைன்

தகவல் அறிவியலில் தேவைப்படும் ஒரு முக்கியமான விஷயம், தகவல்களை தூசு தட்டி சுத்தம் செய்வது. அதற்கும் பல மென்பொருட்கள் இருக்கின்றன. அதில் முக்கியமான ஒன்று ஓப்பன் ரிஃபைன். கூகிள் ரிஃபைன் என முன்பு அழைக்கப்பட்டு வந்த மென்பொருளும் இது தான்.

தகவலை தூய்மைப்படுத்துவது, தேவையற்றவற்றை நீக்குவது,ஒன்றிலிருந்து இன்னொரு வகைக்கு தகவலை மாற்றுவது,தகவலை உடைத்து சின்னச் சின்ன தகவல்கள் ஆக்குவது என பல்வேறு பணிகளை இந்த மென்பொருள் செய்யும்.

7. KNIME

பயன்படுத்துவதற்கு மிக எளிமையான ஒரு மென்பொருள். இங்கிலாந்தில் பல நிறுவனங்கள் இந்த மென்பொருளை பயன்படுத்துகின்றன. பல மென்பொருட்களை இத்துடன் இணைத்து பணிபுரியலாம் என்பது இதிலுள்ள ஒரு பிளஸ். வேதியில் தகவல்களையும் இந்த மென்பொருளில் பயன்படுத்தலாம் என்பது இதிலுள்ள இன்னொரு சிறப்பம்சம்.

தகவல்களை அலசுவதற்கும், பிற பல தகவல்களோடு இணைப்பதற்கும் இந்த மென்பொருள் பயன்படும்.

8. நோட் எக்ஸ் எல்.

சமூக வலைத்தளங்களிலுள்ள தகவல்கள் டேட்டா சயின்ஸ் துறையில் முக்கிய பங்கு ஆற்றுகின்றன என்பது நமக்குத் தெரியும். இந்த மென்பொருள் அதில் சிறப்பிடம் பெறுகிறது. நெட்வர்க், சமூக வலைத்தளம், மென்பொருள் எல்லாவற்றையும் இணைக்கும் பாலமாக இந்த மென்பொருள் உதவும்.

தகவலை உள்ளீடு செய்வதற்கு, அதை படங்களாக காட்சிப்படுத்துவதற்கு, படங்களை அலசி ஆராய்வதற்கு, தகவல்களை அறிக்கைகளாக மாற்றுவதற்கு என பல விஷயங்களுக்கு இது பயன்படும். எக்ஸெஸ் மென்பொருளை மையமாக வைத்து இது இயங்குகிறது என்பது இதன் பயன்பாட்டு எல்லையை அதிகரித்திருக்கிறது எனலாம்.

9. Paxata

இன்னொரு பிரபலமான தகவல்களை சரிசெய்யும் மென்பொருள். மென்பொருள் துறையில் பரிச்சயம் இல்லாதவர்களும் இதை எளிதில் பயன்படுத்தலாம் என்பது இதன் முக்கியமான அம்சம். தகவல்களை வரைபடங்களாக மாற்றி அதிலுள்ள குறைகளை எளிதில் சுட்டிக்காட்டும். தேவையான மாற்றங்களைச் செய்து கொள்ள அது அனுமதிக்கும். பின் அந்த தகவல்களை வேறு வடிவில் மாற்றுவதற்கும் கைகொடுக்கும்.

தகவல்களை எந்த வடிவத்தில் பார்க்க விரும்புகிறீர்களோ அப்படிப் பார்க்க இதில் பல வசதிகள் உண்டு. பல தகவல் கூட்டங்களை இணைத்து புதிய தகவல் வகையை உருவாக்கவும் இதில் வசதிகள் உண்டு. ஸ்மார்ட் ஃபூஷன் எனப்படும் இதற்கான சிறப்பு மென்பொருள் வசதி இதில் மட்டுமே உண்டு.

10 நரேட்டிவ் சயின்ஸ்

இதிலுள்ள சிறப்பம்சம் தகவல்களை உள்ளீடு செய்தால் தானாகவே அறிக்கைகளை தயாராக்கும் என்பது தான். தகவல்களை வாசித்துப் பார்த்து எத்தகைய அறிக்கையை உருவாக்கலாம் என்பதை முடிவு செய்து அதுவாகவே உருவாக்கும்.

இதில் ஆர்டிபிஷியல் இன்டெலிஜென்ஸ் தொழில்நுட்பம் உண்டு. அது தான் தகவல்களை பயன்பாட்டாளருக்குத் தேவையான வகையில் ஆட்டோமேட்டிக்காகவே உருவாக்கித் தரும். ரொம்ப கஷ்டம் இல்லாமலேயே டேட்டா சயின்டிஸ்ட்களுக்கு தேவையான தகவல்களை இது தரும் !

Data Science 5 : தகவல் அறிவியல் 5

Image result for data science

கடந்த வாரங்களில் தகவல் அறிவியல் என்றால் என்ன என்பதைப் பற்றியும், அதன் பயன்கள் பற்றியும், அந்தத் துறையில் உள்ள பல்வேறு வேலை வாய்ப்பு விஷயங்கள் பற்றியும் பார்த்தோம். இந்த வாரம் தகவல் அறிவியல் துறைக்குள் நுழைந்து அங்கே அப்படி என்ன தான் வேலை செய்கிறார்கள் என்பதை எட்டிப் பார்க்கப் போகிறோம் !

அப்படி தகவல் அறிவியல் துறையில் என்ன வேலை தான் செய்கிறார்கள் ?

1. பிரச்சினையை புரிதல் !

தகவல் அறிவியலின் ஆகப் பெரிய விஷயமே ஒரு நிறுவனத்தின் பிரச்சினை என்ன என்பதைப் புரிந்து கொள்வது. பிரச்சினை என்ன என்பதைப் புரிந்து கொள்வது என்பது இரண்டு நிலை கொண்டது. ஒன்று ‘இது தான் என்னோட பிரச்சினை’ என முன்வைப்பது. இரண்டாவது, ‘இந்த பிரச்சினை இல்லாமல் எனக்கு இப்படிப்பட்ட ஒரு நிலை வேண்டும்’ என்பது !

ஒரு பிரச்சினையை அக்கு வேறு ஆணி வேறாகப் புரிந்து கொள்வது தகவல் அறிவியலில் மிக முக்கியம். அதற்கு ஏகப்பட்ட கேள்விகளைக் கேட்க வேண்டும். கேள்விகள் பிரச்சினைகளை அதிகப்படுத்தி, அதிலுள்ள அடிப்பட்ட விஷயங்கள் வரை வெளிக்கொணரும். எந்த அளவுக்கு பிரச்சினையை பிரச்சினையைப் புரிந்து கொள்கிறோமோ, அந்த அளவுக்கு தெளிவான தீர்வுகள் கிடைக்கும். பிரச்சினையைப் புரிந்து கொள்ளாமல் களத்தில் இறங்குவது தவகல் அறிவியல் துறையைப் பொறுத்தவரை மிகப்பெரிய பிழை.

உதாரணமாக, “நிறைய கஸ்டமர்களை ஈர்க்க வேண்டும்” என்பது ஒரு வரி தேவையாக இருக்கலாம். அதை வைத்துக் கொண்டு தகவல் அறிவியலில் எதுவும் செய்ய முடியாது. நீங்கள் என்ன செய்கிறீர்கள், எப்படிப்பட்ட கஸ்டமர்கள் வேண்டும், யாரெல்லாம் போட்டியாளர்கள்,அவர்களிடம் எவ்வளவு கஸ்டம்ர்கள் இருக்கிறார்கள், உங்கள் கஸ்டமர்களின் விமர்சனங்கள் என்ன ? குறைகள் என்ன ? எவ்வளவு நாட்கள் சராசரியாக உங்களோடு இருக்கிறார்கள் என தொடங்கி நூற்றுக்கணக்கான கேள்விகளை வரிசையாக எழுப்பினால் உங்களுக்கு கொஞ்சம் கொஞ்சமாக விஷயம் புரியத் துவங்கும்.

எந்த அளவுக்கு கேள்விகளைக் கேட்கிறீர்கள், எந்த அளவுக்கு தொடர்புடைய கேள்விகளைக் கேட்கிறீர்கள் என்பதை வைத்து உங்களுடைய முடிவுகளுக்கு தெளிவு கிடைக்கும். சில கேள்விகள் தான் மாற்றங்களைக் கொண்டு வரும். நிறுவனமே யோசிக்காத விஷயங்களை யோசிக்கத் துவங்குவதும் அப்போது தான். பிரச்சினையை புரிந்து கொள்வதற்கான ‘பிரெயின் ஸ்டாமிங்’ என இந்த விவாதத்தை அழைப்பதுண்டு.

2. தகவல் சேகரிப்பு

பெயரைக் கேட்டாலே புரிஞ்சிருக்குமே ! இருக்கின்ற தகவல்களையெல்லாம் சேகரிப்பது தான் இந்தக் கட்டம். ஆனால் அது நாம் நினைப்பது போல எளிதல்ல. தகவல்கள் எப்போதும் ஒரு நாலு ஃபைல்களில் இருப்பதில்லை. தகவல்கள் எங்கே இருக்கின்றன என்பதைக் கண்டுபிடிக்கவே நிறைய தகவல்கள் தேவைப்படும். அந்த தகவல்களைக் கண்டுபிடித்தபின் அதைச் சேகரிக்க வேண்டும்.

முதலில் வகைப்படுத்தப்பட்ட தகவல்கள் என்னென்ன இருக்கின்றன என்பதைக் கண்டுபிடித்து அவற்றை சேகரிக்க வேண்டும். இது எளிதான பணி. அதிக பயனளிக்கக் கூடிய தகவலும் இது தான். ஆனால் இது மட்டுமே முழுமையான தகவல் அல்ல. உதாரணமாக அலுவலக டேட்டாபேஸை எடுத்து அதிலுள்ள தகவல்களை இழுத்தெடுப்பது ! நிறைய பயனுள்ள தகவல்கள் கிடைக்கும்.

பின்பு நிறுவனம் சார்ந்த மற்ற இடங்களில் இருக்கின்ற தகவல்களை சேகரிக்க வேண்டும். உதாரணமாக அது ஒரு வலைத்தளமாக இருக்கலாம். நிறுவனத்தின் இன்ட்ரா நெட் எனப்படும் பாதுகாப்பான தனி வலைத்தளமாக இருக்கலாம். அவற்றையெல்லாம் சேகரிப்பது கொஞ்சம் கஷ்டமான பணி.

அடுத்தது அலுவலகத்திலுள்ள தகவல்களில் வகைப்படுத்தப்படாத தகவல்களைச் சேகரிப்பது. தலைவலியான வேலை என இதைச் சொல்லலாம். வகைப்படுத்தாத தகவல் எப்படி வேண்டுமானாலும் இருக்கலாம். ஒரு வீடியோவாகவோ, ஆடியோவாகவோ, ஒரு கிறுக்கல் கையெழுத்தாகவோ, ஒரு வாய்ச்சொல்லாகவோ எப்படி வேண்டுமானாலும் இருக்கலாம். அவையும் சேகரிக்கப்பட வேண்டும். அப்போது தான் முழுமையான ஒரு தீர்வுக்குள் செல்ல முடியும்.

தகவல்களைச் சேகரிக்கும் போது, முதல் கட்டத்தில் நாம் ஏகப்பட்ட கேள்விகளைக் கேட்டோமல்லவா ? அந்த அத்தனை கேள்விகளுக்குமான விடைகள் வந்திருக்கின்றனவா என்பதை பரிசீலனை செய்ய வேண்டும். புதிதாக கேள்விகள் கேட்க வேண்டிய தேவையிருந்தால் கேட்கலாம். இந்த கட்டம் மிக முக்கியமான கட்டம். இதில் தவற விடுகின்ற முக்கியமான தகவல்கள் நிறுவனத்தின் முடிவுகளை பெரிய அளவில் பாதிக்க வாய்ப்பு உண்டு.

3. தகவல் செயல்முறை

தகவல் அறிவியலின் முதுகெலும்பு என்பது தகவல் செயல்முறை அதாவது டேட்டா புராசசிங். பிரச்சினையைப் புரிந்து கொள்வதும், தகவல்களை சேகரிப்பதும் எந்த அளவுக்கு சிறப்பாக நடந்திருக்கிறது என்பதை வைத்து தான் இந்த செயல்முறைப் பகுதி வெற்றியடையுமா தோல்வியடையுமா என்பதைச் சொல்ல முடியும்.

தகவல் செயல்முறைக்கு முன்பு இருக்கின்ற ஒரு வேலை தகவல்களை தூசு தட்டி துடைத்து எடுப்பதும். தேவையற்ற தகவல்களை உடைத்து எறிவதும் தான். அந்த வேலைக்காகத் தான் பெரும்பாலான நேரத்தை தகவல் அறிவியலார்கள் செலவிடுவார்கள். சுமார் 70 முதல் 80 சதவீதம் நேரம் தேவையற்ற தகவல்களை நீக்குவதில் செலவாகும் என்கிறது ஒரு ஆய்வு.

தேவையற்ற ஒரு தகவல், முடிவில் மிகப்பெரிய மாற்றத்தை உருவாக்கி விடக்கூடும். எனவே தான் தேவையற்ற தகவல்களை அகற்ற வேண்டியது அவசியாகிறது. எல்லா பாடத்துக்கும் தோற்றுப் போகும் ஒரு மாணவனுக்கு, கணிதத்தில் 400 மதிப்பெண் என தவறாகப் பதிவாகியிருந்தால் மொத்த சதவீதத்தில் அவன் பெயர் முன்னணியில் வருமில்லையா ? அதே போல நினைத்துக் கொள்ளுங்கள்.

இந்த இடத்தில் மென்பொருட்கள் உதவிக்கு வரும். இருக்கின்ற தகவல்களை நாம் அப்படியே எதுவும் செய்து விட முடியாது. அதை அலச, அதை வைத்து உருப்படியாய் ஏதாவது செய்ய கணினியின் உதவி மிக மிக அவசியம். பைத்தான் , ஆர் போன்ற மென்பொருட்கள் இந்த இடத்தில் மிகப்பெரிய உதவியாய் இருக்கும்.

4. தகவல் ஆராய்ச்சி

இப்போது கைவசம் இருப்பவை நல்ல தகவல்கள். முறைப்படுத்தப்பட்ட தகவல்கள். இவற்றை வைத்துக் கொண்டு எப்படியெல்லாம் வித்தை காட்டலாம் என்பது தான் தகவல் அறிவியலின் ஒட்டு மொத்த விஷயம்.

இந்த தகவல்களை அலசி, ஆராய்ந்து, தொடர்புகளைக் கண்டறிந்து அதன்’பேட்டர்ன்’ அதாவது முறைகளை அறிந்து, அதைக் கொண்டு நிறுவனத்துக்குத் தேவையான தீர்வுகளை உருவாக்கும் இடம் இது தான்.

இங்கே எப்படி தகவலை நாம் காட்சிப்படுத்திப் பார்க்கிறோம், மனதுக்குள் படமாக விரித்துப் பார்க்கிறோம் என்பது மிக முக்கியம். அது தான் நிறுவனத்திற்குத் தேவையான தீர்வுகளை நோக்கி வழிநடத்தும்.

இந்த அலசலில் கிடைக்கின்ற தகவல்களை, பேட்டர்ன்களை வைத்து தான் ஆழமான அலசல் செய்ய முடியும். ஆழமன அலசலுக்குள் நுழைவதற்கு முன் தகவல்களை எப்படியெல்லாம் பயன்படுத்தலாம் என்பது குறித்த ஒரு பார்வை இருக்க வேண்டும். இந்த கட்டம் அதைத் தான் தரும்.

5. ஆழமான அலசல்

இந்த கட்டத்தில் தான் கண்டறிந்த தகவல்களை வைத்துக் கொண்டு நிறுவனம் எதிர்பார்க்கின்ற மாடலை உருவாக்கும் வேலை நடைபெறும். இந்த தகவல்களை எப்படிப் பயன்படுத்தினால் எப்படிப்பட்ட பயன்கள் கிடைக்கும் என்பதைக் கணிக்கும் ‘பிரடிக்டிவ் மாடல்’ உருவாவது இப்போது தான்.

இந்த இடத்தில் மீண்டும் சில கேள்விகளை எழுப்ப வேண்டும் ! நான் என்ன மாடலை கணிக்கப் போகிறேன். எனது நோக்கம் என்ன ? அது தான் நிறுவனம் எதிர்பார்க்கின்ற விஷயமா ? நிறுவனத்தின் நோக்கத்தோடும், எதிர்பார்ப்போடும் நான் ஒத்துப் போகிறேனா ? என்பதையெல்லாம் கேள்விகள் மூலம் உறுதி செய்து கொள்ள வேண்டியது முக்கியம்.

ஒரு மாடலை மட்டும் உருவாக்கி நிறுவனத்துக்கு அளிப்பது சரியான முறையல்ல. அது முழுமையான, சரியான, பக்காவான ஒரு தீர்வைத் தருமென்பதில்லை. எனவே பல மாடல்களை உருவாக்கி அதில் எது சிறந்ததாக இருக்கிறதோ, அதைப் பயன்படுத்துவதே சரியான வழி.

அல்காரிதங்கள், மெஷின் லேர்னிங் கான்செப்ட் போன்றவற்றையெல்லாம் பயன்படுத்தும் சரியான இடம் இது தான்.

எவ்வளவு தெளிவான, அழகான மாடலிஅ உருவாக்குகிறோம் என்பதல்ல முக்கியம். அந்த மாடல் நமக்குத் தேவையான ஒரு தீர்வைத் தருமா என்பதே கேள்வி. அதற்குத் தேவையான முயற்சிகளை எடுப்பதே இங்கே முக்கியமான விஷயம்.

5. அறிக்கை தயாரித்தல்

ரிப்போர்ட் ஜெனரேஷன் என்பது எந்த ஒரு பணியிலும் கிட்டத்தட்ட கடைசியில் வருகின்ற ஒரு வேலை. அது தான் அந்த ஒட்டு மொத்தப் பணிக்கும் ஒரு மரியாதையைக் கொண்டு வரும். ராப்பகலா கண்ணு முழிச்சு படிச்சேன், ஆனா பரீட்சைக்கு எதுவும் எழுதல என்றால் எப்படி இருக்கும். அதே போல தான், என்ன தான் முழு உழைப்பையும் போட்டு மாடல் உருவாக்கினாலும், அதை சரியான முறையில் காட்டவில்லையேல் பயனில்லை.

இந்த ஏரியாவை பலரும் அலட்சியமாக நினைப்பதுண்டு. ஆனால் இது மிக முக்கியமான ஒரு கட்டம் என்பதைப் புரிந்து கொள்ள வேண்டும்.

பார்த்தவுடன் பளிச் என புரிகின்ற படங்கள் மூலமாகவோ, புள்ளி விவரங்கள் மூலமாகவோ, இதை எளிமையாக விளக்குவது பயனளிக்கும். டைனமிக் ரிப்போர்ட்டிங் எனப்படும் தகவல்களை மாற்றுவதற்கு ஏற்ப மாறுகின்ற ஆன்லைன் ரிப்போர்டிங் இங்கே ரொம்ப வலிமையானது.

இவை தான் தகவல் அறிவியல் வேலையில் நடக்கின்ற பணிகள்.

( தொடர்வோம் )

தகவல் அறிவியல் – 4

Image result for data science

தகவல் அறிவியல் துறையில் வேலை வாய்ப்புகள் அதிகமாய் இருக்கிறது என்பதையும்,  கணிதம், பட்டப்படிப்பு, மென்பொருள் போன்றவற்றைப் படித்தவர்களுக்கு அங்கே வேலை வாய்ப்புகளும் அதிகமாய் இருக்கின்றன என்பதையும் கடந்த வாரம் அலசினோம். அப்படி இந்த துறையில் எப்படிப்பட்ட வேலைகள் இருக்கின்றன என்பதைப் பற்றிய ஒரு அறிமுகத்தைப் பார்போம்.

தகவல் அறிவியல் துறையில் பல்வேறு வேலைகள் இருக்கின்றன. நிறுவனத்தின் தேவைக்கும் தன்மைக்கும் ஏற்ப அவர்கள் அவற்றுக்கு பெயரிட்டு அழைப்பதும் உண்டு. உதாரணமாக சில நிறுவனங்கள் தகவல் விஞ்ஞானத்தை, மெஷின் லேர்னிங் என்றும் அழைப்பதுண்டு. பொதுவாக எப்படிப்பட்ட வேலைகள் இந்த துறையில் உண்டு என்பதை பார்ப்போம்.

மேஜேஜ்மென்ட் இன்ஃபர்மேஷன் சிஸ்டம்ஸ் ரிப்போர்டிங் எக்சிகியூட்டிவ் ( MIS Reporting Executive ) என ஒரு பணி இருக்கிறது. தகவல் அறிவியலைப் பொறுத்தவரை இது ஒரு மிக முக்கியமான பணி. வணிகத் தேவை என்ன என்பதை சரியாகப் புரிவதும், தொழில்நுட்பத்தில் அதை எப்படி புகுத்துவது என்பதையும் இவர்கள் தான் முடிவு செய்வார்கள். அதாவது இவர்கள் கொடுக்கின்ற அறிக்கைகளின் அடிப்படையில் தான் பெரும்பாலான பிசினஸ் முடிவுகள் எடுக்கப்படும்.

இவர்களுடைய பணி, நிறுவனத்துக்குத் தேவையான அறிக்கைகளை பல்வேறு வகைகளில் உருவாக்குவது. நூற்றுக்கணக்கான பக்கங்களில் எழுதி வைக்கவேண்டிய தகவல்களை ஒரு சின்ன படத்தின் மூலம் காட்டி விடும் வித்தை இவர்களின் சிந்தனைக்கு உரியது.

உதாரணமாக, விற்பனைத் தகவல்கள் என்னென்ன ? என்னென்ன பொருட்கள் கைவசம் இருக்கின்றன ? எப்படிப்பட்ட விமர்சனங்கள் வந்திருக்கின்றன ? போன்ற  பல்வேறு தகவல்களை இவர்கள் அலசுவார்கள். அதன் அடிப்படையில் அவர்கள் உருவாக்கும் அறிக்கைகள் முக்கியமான தொழில் முடிவுகள் எடுக்க வசதியாக இருக்கும்.

கணினி துறை அல்லது பொறியியலில் பட்டப்படிப்பு இருப்பவர்கள் இந்தத் துறையில் நுழைவது அவர்களுக்கு எளிதாக இருக்கும். “எப்படிப்பட்ட தகவல்களைக் கொடுத்தால் பிஸினஸ் வளரும்” என்கின்ற ஒரு பரந்து பட்ட பார்வை இருக்க வேண்டியது அவசியம். காரணம், இவர்கள் கொடுக்கின்ற தகவல்களே பிஸினஸை அடுத்த நிலைக்கு கொண்டு செல்லவும், எப்படிப்பட்ட திசையில் பயணிக்க வேண்டும் என்பதை முடிவு செய்யவும், எப்படிப்பட்ட மாற்றங்களைக் கொண்டு வரவேண்டும் என்பதைத் தீர்மானிக்கவும் உதவுகின்றன.

பிஸினஸ் அனலிஸ்ட் ; இன்னொரு முக்கியமான பணி. இதை வணிக ஆய்வாளர் பணி என்று சொல்லலாமா ? அல்லது தொழில் ஆய்வாளர் என்று சொல்லலாமா தெரியவில்லை. இப்போதைக்கு பிசினஸ் அனலிஸ்ட் என்றே வைத்துக் கொள்வோம்.

ஒரு நிறுவனத்தின் தேவையை துவக்கத்திலிருந்தே கவனிப்பது இவர்களுடைய வேலை. ஒரு பிஸினஸ் வளர்ச்சியடைய என்னென்ன தடைகள் இருக்கின்றன. என்னென்ன இடைவெளிகள் இருக்கின்றன என்பதைக் கண்டறிவது இவர்களுடைய வேலையின் முக்கியமான அம்சம்.

தகவல்களை அலசி ஆராய்பவர்களைத் தகவல் ஆய்வாளர் என்று சொல்வோம். அதே போல பிஸினஸை அலசி ஆராய்பவர்களே இந்த பிஸினஸ் அனலிஸ்ட் என அழைக்கப்படுகின்றனர்.

பிஸினஸ் அட்மினிஸ்ட்ரேஷன் (எம்.பி.ஏ) பிரிவில் ஒரு பட்டப்படிப்பு இருப்பது இந்த வேலைக்கு ரொம்ப நல்லது. கூடவே தகவல்களோடு விளையாடும் ஆர்வம் இருக்க வேண்டும். பிஸினஸை எப்படியெல்லாம் வலுப்படுத்தலாம் எனும் பார்வை இருக்க வேண்டியதும் அவசியம்.

பிஸினஸின் தேவையை சரிவரப் புரிந்து அதிலுள்ள குறைகளைக் களைந்து தொழில்நுட்பத்தின் மூலம் அதை வலுப்படுத்தும் பணியே இந்த பிஸினஸ் அனலிஸ்ட் பணி.

டேட்டா அனலிஸ்ட்

தகவல் அறிவியலில் மிக முக்கியமான பணிகளில் ஒன்று டேட்டா அனலிஸ்ட் வேலை. தகவல்களைத் திரட்டுவது, திரட்டிய தகவல்களை வகைப்படுத்துவது இரண்டும் இவர்களுடைய கைவேலைகள். இவர்களும் டேட்டா விஞ்ஞானிகள் அதாவது டேட்டா சயின்டிஸ்ட் இருவரும் வேறு வேறு.

டேட்டா அனலிஸ்ட் என்பவர் அவருக்கு ரொம்ப ஜூனியர் என்று வேண்டுமானால் வைத்துக் கொள்ளலாம். ஆனால் மிக முக்கியமான அடிப்படைப் பணிகள் செய்வது இவர்கள் தான்.

டேட்டா அனலிஸ்ட் என்பவர் ஒரு சில முக்கியமான மென்பொருட்களைப் பற்றித் தெரிந்திருக்க வேண்டும். குறிப்பாக ஆர், பைத்தான், எச்.டி.எம்.எல், எஸ்.க்யூ.எல், சி ++, ஜாவா போன்ற அனைத்து மென்பொருட்களின் கலவையாய் உங்களுடைய மென்பொருள் பரிச்சயம் இருப்பது மிக சிறப்பு.

தகவல்களை சேர்ப்பது, சேமிப்பது இவற்றோடு இவர்களுடைய பணி முடிந்து விடுவதில்லை. எப்படி அதை பயன்படுத்துவது என்பதையும் இவர்கள் யோசிக்க வேண்டும். ஹடூப் போன்ற மென்பொருட்களைக் கற்பது பயன்கொடுக்கும்.

நிறுவனத்தின் பல்வேறு நிலைகளிலுமுள்ள தலைவர்கள், வெவ்வேறு தகவல் தேவைகளோடு அணுகுவது இவர்களைத் தான். இவர்களும் அவர்களுடைய தேவைகளை நிறைவேற்றும் வகையில் தங்களுடைய மூளையையும், கையிலுள்ள தகவலையும் கசக்குவார்கள்.

எப்படி தகவலை வகைப்படுத்துவது, அதை எப்படி பயனுள்ள வகையில் மாற்றுவது, அல்காரிதங்களை/வழிமுறைகளை எழுதுவது, என்பதையெல்லாம் கவனிப்பது இவர்கள் தான்.

  1. ஸ்டாட்டிஸ்டிஷியன் / புள்ளிவிவர ஆய்வாளர்

ஸ்டாட்டிஸ்டிக் விஷயங்களைச் சொல்லும் இவரைப் புள்ளி விவரப் புலி என்று சொல்லலாமா ? தகவல்களைச் சேர்த்து, வகைப்படுத்தி, பயன்படுத்துவத்தோடு மட்டுமல்லாமல், அதன் அடிப்படையில் முடிவுகளையும் எடுப்பது இவர்களுடைய வேலை.

மார்க்கெட் ரிசர்ட், போக்குவரத்து, கல்வி, விளையாட்டு, என எல்லா இடங்களிலும் இவர்களுடைய தேவை உண்டு. இந்த வேலைக்குள் நுழையவேண்டுமென்றால் பட்டப்படிப்பு அவசியம். அதிலும் குறிப்பாக  ஸ்டாடிஸ்டிக்ஸ் அல்லது கணிதவியலில் பட்டம் இருந்தால் ரொம்ப நல்லது.

இவர்களும் ஆர் போன்ற ஏதோ ஒரு மென்பொருளின் மீது அதிக பரிச்சயம் கொண்டிருக்க வேண்டியது அவசியம். இவர்களுடைய பணிக்கென பல மென்பொருட்கள் உள்ளன MATLAB, SAS, Python, Stata, Pig, Hive, SQL, Perl போன்றவை புள்ளிவிவரவியலாளர் அல்லது ஸ்டாட்டிஸ்டிஷியன் பணிக்கு உதவுவதற்காக இருக்கின்ற மென்பொருட்கள். இவற்றில் சிலவற்றைக் கற்றுக்கொள்வது பயனளிக்கும்.

தகவல்களை அலசி அதில் ஒரு பேட்டர்ன் அதாவது முறையைக் கண்டுபிடிப்பது, தகவல்களுக்கு இடையே உள்ள தொடர்பைக் கண்டுபிடிப்பது, ஒரு டிரென்ட் கண்டுபிடிப்பது போன்றவற்றையெல்லாம் இவர்கள் கவனிப்பார்கள்.

5

டேட்டா சயின்டிஸ்ட்

இன்றைக்கு இருக்கக் கூடிய தகவல் அறிவியல் வேலைகளில் ஹாட் வேலை என்றால் இது தான். இதற்கு கொஞ்சம் அனுபவம் இருக்க வேண்டும். எல்லா நிறுவனங்களிலும் டேட்டா சயின்டிஸ்ட் வேலை தேவை இருக்கும். ஒவ்வொரு நிறுவனத்துக்கும் கொஞ்சம் கொஞ்சம் வித்தியாசமான திறமைகளில் டேட்டா சயின்டிஸ்ட் தேவைப்படுவார்கள்.

மென்பொருட்களின் மீதான பரிச்சயம் இதற்கு மிக மிக அவசியம்.  R, SAS, Python, SQL, MatLab, Hive, Pig, மற்றும் Spark போன்றவை இதற்குத் தேவையான மென்பொருட்கள் !

ஒரு நல்ல தகவல் விஞ்ஞானியின் வேலை தகவல்களோடு முடிந்து விடுவதில்லை. அந்த தகவல்களுக்கும் நிறுவனத்துக்கும் இடையேயான பிணைப்பைக் கண்டறியும். அந்த தொடர்பை வைத்துக் கொண்டு எப்படியெல்லாம் பிஸினஸை வளர்த்தலாம் என்பதை அலசும்.

இந்த பணிக்கு ஆர்வமும், பொறுமையும் மிக மிக அவசியம். நல்ல தெளிவான சிந்தனையும், திறமையும் இருந்தால் இந்தத் துறையில் கலக்கலாம்.

ஒரு டேட்டா சயின்டிஸ்ட் என்பவர் சுருக்கமாகச் சொல்லவேண்டுமெனில் ஒரு டேட்டா அனலிஸ்ச்ட், ஒரு பொறியாளர், ஒரு பிஸினஸ் அனலிஸ்ட் போன்ற பலவற்றின் கலவையாக இருப்பார்.

6

டேட்டா எஞ்சினியர்

பெரும்பாலும் பிக்டேட்டா சார்ந்த பணிகளைக் கவனிப்பதற்கு டேட்டா எஞ்சினியர்கள் தேவைப்படுவார்கள். இவர்களை டேட்டா ஆர்கிடெக்ட் என்றும் அழைப்பார்கள்.

தகவல் பொறியாளர்களுக்கு கணினி பிரிவில் ஒரு பட்டப்படிப்பு அவசியம். கூடவே Pig, Hadoop, MapReduce, Hive, MySQL, Cassandra, MongoDB, NoSQL போன்றவற்றில் பரிச்சயம் இருப்பது தேவையானது. அதே போல மென்பொருட்களான R, Python, Ruby, C++, Perl, Java, SAS, SPSS, and Matlab போன்றவற்றில் நல்ல பரிச்சயம் இருக்க வேண்டியதும் மிக மிக அவசியம்.

தகவல்களை வகைப்படுத்துவது, அதை டெஸ்ட் செய்வது, அதை நிறுவனத்தின் தேவைக்கு ஏற்ப அறிக்கையாய், படங்களாய் சமர்ப்பிப்பது இவையே இவர்களுடைய முக்கியமான வேலை.

இவை தவிர, பிக்டேட்டா பொறியாளர், மெஷின் லேர்னிங் பொறியாளர் என பலர் இந்த தகவல் அறிவியல் துறையின் பட்டியலில் வருவார்கள்.

மேலே குறிப்பிட்டுள்ளவை தகவல் அறிவியல் துறையிலுள்ள சில முக்கியமான வேலைகள். இவற்றைத் தவிரவும் பல வேலைகள் தகவல் அறிவியல் துறையில் உண்டு. இந்தப் பணிகளுக்குத் தேவையான திறமைகளை வளர்த்துக் கொண்டால் தகவல் அறிவியல் துறையில் நுழைவதில் சிக்கல் இருக்காது.

Data Science 3 : தகவல் அறிவியல் ‍ 3

Image result for data science

தகவல் அறிவியலின் பரபர வளர்ச்சி இன்றைக்கு இளைஞர்களை வெகுவாக‌ வசீகரித்திருக்கிறது. அதை நோக்கி பலர் தங்களுடைய பார்வையைத் திருப்பியிருக்கின்றனர். இதையே வாய்ப்பாக வைத்துக் கொண்டு பலர் ஃபாஸ்ட் புட் போல‌ பயிற்சி நிலையங்களை உருவாக்கி தகவல் அறிவியல் கற்றுத் தருகிறேன் என வலை விரிக்கத் துவங்கியிருக்கின்றனர். பயிற்சி நிலையம் சின்னதாக இருக்கிறதா ? பெரியதாக இருக்கிறதா என்பதல்ல பிரச்சினை. சரியான விதத்தில், சரியானவர்களால், சரியானவைகளைக் கற்றுத் தருகிறார்களா என்பதே முக்கியம்.

தகவல் அறிவியல் மீதான வசீகரம் இருப்பது நல்லது தான். நீச்சல் தெரியாமல் குளத்தில் குதிப்பதைப் போலவோ, நீச்சலே பிடிக்காமல் குளத்தில் குதிப்பதைப் போலவோ டேட்டா சயின்ஸ் துறையில் நுழைவது காலவிரயம் ! யாரெல்லாம் தகவல் அறிவியலைக் கற்றுக் கொள்ளலாம் ?. அல்லது டேட்டா சயின்ஸைக் கற்றுக் கொள்ள  என்னென்ன திறமைகள் இருக்க வேண்டும் ? என்பதைப் பற்றிய ஒரு அடிப்படைப் புரிதல் நமக்கு இருக்க வேண்டும்.

இன்றைக்கு தகவல் அறிவியலைக் குறித்து பேசும் பலரும் பல விதமான தகவல்களைத் தருகின்றனர். இதில் எது சரி, எது தவறு என்பதைப் புரிந்து கொள்வதில் பலருக்கும் குழப்பம். ஹடூப், மெஷின் லேர்னிங், அனாலிடிக்ஸ், சயின்டிஸ்ட் போன்ற வார்த்தைகள் தகவல் அறிவியல் துறையில் நுழைய விரும்பும் இளைஞர்களை குழப்பக் கூடும். எனவே தகவல் அறிவியல் குறித்து இதுவரை மற்றவர்கள் சொன்ன விஷயங்களை கொஞ்ச நேரம் ஒதுக்கி வையுங்கள். தகவல் அறிவியலுக்குள் நுழைய அடிப்படையாக என்னென்ன தேவை என்பதை மிக மிகச் சுருக்கமாகப் பார்த்து விடுவோம்.

முதலாவது, தகவல் அறிவியல் என்பது எண்களோடு விளையாடும் வேலை. புள்ளி விவரங்கள், கூட்டல், கழித்தல், அல்காரிதம், கேல்குலஸ், நிகழ்தகவு போன்ற விஷயங்கள் தகவல் அறிவியலின் முதுகெலும்பாக இயங்கக் கூடியவை. இவை எல்லாமே கணிதவியலின் அடிப்படை விஷயங்கள். எனவே, தகவல் அறிவியல் கற்றுக் கொள்ள விரும்புபவர்களுக்கு முதலில் இருக்க வேண்டிய தகுதி, கணிதவியலில் அறிவு.

அதற்காக கணிதவியலில் இளங்கலைப் பட்டமோ, முதுகலைப் பட்டமோ இருந்தால் தான் தகவல் அறிவியலில் நுழைய முடியும் என்றில்லை. கணிதத்தின் மீது ஆர்வமும், அடிப்படை அறிவும், கற்றுக் கொள்ளும் விருப்பமும் இருந்தால் போதும். கணிதம் என்றாலே காத தூரம் ஓடுபவர்கள் தகவல் அறிவியல் பக்கம் வராமல் இருப்பது நல்லது அப்படிப்பட்டவர்களுக்கு தேவையற்ற மன அழுத்தங்களை தகவல் அறிவியல் தரலாம்

தகவல் அறிவியல் துறைக்கு பல்வேறு நிலையிலுள்ள மக்களும் வருகின்றனர். இப்போது தான் படித்து முடித்த மாணவர்கள் முதல் பி.ஹைச்.டி முடித்த அறிவர்கள் வரை இதில் அடக்கம். அதனால் சிலர், “பி.ஹைச்.டி படித்தால் தான் இதெல்லாம் புரியும் போல !”, என தவறாய் நினைப்பதுண்டு. அந்த நினைப்புகளையெல்லாம் முளையிலேயே கிள்ளி எறியுங்கள்.

இரண்டாவது தேவை, கணினி அறிவு. மென்பொருள் எழுதத் தெரிந்திருக்க வேண்டும் என்பது அடிப்படைத் தேவை. அட்வான்ஸ் மென்பொருட்கள் தெரிந்திருக்க வேண்டியதில்லை. அவற்றைப் படிப்படியாகக் கற்றுக் கொள்ளலாம். ஆனால் அடிப்படை மென்பொருள் அறிவு கண்டிப்பாகத் தேவை. தகவல்களை அல்காரிதங்களின் மூலமாய் தேவையான தகவல்களாக மாற்றுவதற்கு மென்பொருள் அறிவு அவசியம்.

பைத்தான். ஆர் போன்ற மென்பொருட்கள் தெரிந்திருந்தால் மிக எளிது. இல்லாவிட்டாலும் பிரச்சினையில்லை. அடிப்படை மென்பொருட்களான சி, சி++, ஜாவா போன்ற மென்பொருட்களில் நல்ல பரிச்சயம் இருந்தாலே போதும். மென்பொருள் பற்றிய பரிச்சயம் அறவே இல்லை என்பவர்களால் தகவல் அறிவியல் துறையில் நுழைய முடியாது. எனவே கொஞ்சம் புரோகிராமிங் பக்கம் பார்வையை செலுத்துவது அவசியம்.

அதிலும், டேட்டா பேஸ் எனப்படும் தகவல் சேமிப்பு மென்பொருட்கள் பற்றிய அறிவு நிச்சயம் இருக்கவேண்டும். எப்படியெல்லாம் தகவல்களை சேமிக்கலாம், அதை எந்தெந்த வகையில் எடுக்கலாம், எப்படியெல்லாம் வகைப்படுத்தலாம், என்னென்ன கேள்விகள் மூலம் தகவல்களைப் பிரித்தெடுக்கலாம் என்பதையெல்லாம் கற்றுக் கொள்ள எஸ்.க்யூ.எல் அடிப்படை அறிவு இருப்பது தேவையானது ! இங்கும் கவனிக்க வேண்டிய விஷயம், இதிலெல்லாம் சூப்பர் டூப்பர் ஆட்களாய் இருக்க வேண்டிய அவசியம் இல்லை என்பது தான். ஆனால் நன்றாகத் தெரிந்திருக்க வேண்டும் என்பது கட்டாயம்.

டொமைன் ஸ்கில்ஸ் எனப்படும் கள அறிவு தகவல் அறிவியல் துறையில் முக்கியமானது. ஆனால் இதை துவக்கத்திலேயே படித்து விட முடியாது. நாம் எந்த துறையில் தகவல் அறிவியல் பணி செய்யப் போகிறோமோ அந்தத் துறை சார்ந்த விஷயங்களைக் கற்றுக் கொள்வது தான் சரியானது. உதாரணமாக மருத்துவத் துறையில் தான் தகவல் அறிவியல் வேலை செய்யப் போகிறீர்கள் என்றால், “ஹெல்த்கேர்’ டொமைன் பற்றி நன்றாகத் தெரிந்து வைத்திருப்பது அவசியம்.

தகவல் அறிவியல் கொண்டு வருகின்ற முடிவுகளை அலசவும், எப்படிப்பட்ட முடிவுகள் பயன்படும் என்பதை முடிவு செய்யவும் டொமைன் ஸ்கில்ஸ் தேவை. மருந்துகளின் தேவைகள் பற்றிய புள்ளிவிவரத்தை அதைப்பற்றி எதுவுமே தெரியாதவர்கள் படித்தால் புரியாது இல்லையா ? அது தான் அடிப்படை விஷயம்.

வங்கித் துறை சார்ந்த தகவல் அறிவியல் எனில் பேங்கிங் டொமைன் கற்றுக் கொள்ள வேண்டும். காப்பீடு துறை சார்ந்த டேட்டா சயின்ஸ் பணியெனில் ‘இன்சூரன்ஸ் டொமைன்’ கற்றுக் கொள்ள வேண்டும். வணிகம் சார்ந்த ஏரியா எனில் ‘ரிடெயில் டொமைன்’ தெரிந்திருக்க வேண்டும். இப்படி தேவையான ஒன்றைத் தெரிந்து கொள்ளலாம். டொமைன் ஸ்கில்ஸ் எனப்படுவதை ஒரே நாளிலோ, ஒரு படிப்பின் மூலமாகவோ கற்றுக் கொள்ள முடியாது. அடிப்படை அறிவைப் பெற்றுக் கொண்டு பின்னர் படிப்படியாக அதை வளப்படுத்திக் கொள்ளலாம்.

தகவலை விஷுவலைஸ் செய்து பார்ப்பது, அதாவது கற்பனை செய்து பார்ப்பது என்பது இந்த படிப்புக்கு தேவையானது. ஒரு துப்பறிவாளன் கையில் கிடைக்கும் ஒரு சின்ன பொருள் ஒரு பெரிய குற்றத்தைத் துப்பு துலக்க உதவுவது போல, தகவல் அறிவியலாளனின் கையில் கிடைக்கின்ற தகவல்கள் மிகப்பெரிய மாற்றத்துக்குரிய விடையைத் தர முடியும். அதற்கு, ‘இந்த தகவலை வைத்து என்ன செய்யலாம்’ என கற்பனை செய்து பார்க்கும் விஷுவலைசிங் திறமை அவசியம்.

அடிப்படையாக ஒரு பட்டப்படிப்பு இருப்பது ரொம்ப நல்லது. கணிதம், அறிவியல், காமர்ஸ் போன்ற பட்டப்படிப்பு இருந்தால் சிறப்பு !  பட்டப்படிப்பு இந்தத் துறையில் உங்களை முழுமையாக ஈடுபடுத்திக் கொள்ளும் ஊக்கத்தைத் தரும். ஒருவேளை வேறு நிறுவனங்களில், துறைகளில் வேலைபார்த்த அனுபவம் உடையவர்கள் பட்டப்படிப்பு இல்லாமலும் இந்த துறையில் நுழையலாம்.

கம்யூனிகேஷன் ஸ்கில்ஸ் எனப்படும் உரையாடல் திறனும் இந்த துறைக்கு ரொம்பவே கை கொடுக்கும். தகவல்கள் எப்போதும் நமக்கு எளிதில் கிடைத்து விடுவதில்லை. அதற்கு நமது உரையாடல்கள் தேவைப்படும். அதே போல, நாம் உருவாக்குகின்ற பணிகளை மிகத் திறமையாக அடுத்தவர்களுக்கு எடுத்துரைக்கவும் கம்யூனிகேஷன் திறமை மிக அவசியம்.

எல்லாவற்றுக்கும் மேலாக இருக்க வேண்டிய இரண்டு முக்கியமான விஷயங்கள் உற்சாகமும், புதுமையை விரும்பும் மனமும். தகவல்களை எப்படியெல்லாம் பயன்படுத்தலாம், எப்படியெல்லாம் அலசலாம், எப்படிப்பட்ட வகைகளில் வகைப்படுத்தலாம் என்பதெல்லாம் புதுமையை விரும்புபவர்களால் மட்டுமே முடிவு செய்ய முடியும். நூல் கண்டு போல சுற்றிப் பிணைந்து கிடக்கின்ற தகவல்களை சிக்கலில்லாமல் பிரித்தெடுக்க, தேவையற்ற தகவல்களை வெட்டி எறிய உற்சாக மனம் ரொம்ப முக்கியம். அடிப்படையாக, பிசினஸை எப்படியெல்லாம் வளப்படுத்தலாம், வலுப்படுத்தலாம் எனும் சிந்தனை ஓடிக்கொண்டே இருக்க வேண்டும். இவையெல்லாம் தான் ஒருவரை தகவல் அறிவியலில் சிறப்புற வைக்கும்.

சுருக்கமாக கணிதத்தில் பரிச்சயமும் ஆர்வமும் இருக்கிறதா ? ஓரளவு மென்பொருள் பரிச்சயம் இருக்கிறதா ? புதுமை செய்யும் ஆர்வம் இருக்கிறதா ? தகவல்களோடு விளையாடும் பொறுமை இருக்கிறதா ? எனில் நீங்கள் தைரியமாக இதில் காலெடுத்து வைக்கலாம்.

( தொடர்வோம் )

Data Science 2 :தகவல் அறிவியல் 2

“வேலை காலியாக இருக்கிறது ! ஐம்பது இலட்சம் பேர் அவசரமாக தேவை”

இன்றைய சூழலில் இப்படி ஒரு விளம்பரம் வந்தால் ஆச்சரியப்படாமல் இருக்க முடியுமா ? உண்மையில் அப்படி ஒரு எண்ணிக்கையிலான அளவுக்கு ‘தகவல் அறிவியல்’ எனப்படும் டேட்டா சயின்ஸ் துறையில் ஆட்கள் தேவைப்படுவார்கள் என்பது தான் யதார்த்தம். அவ்வளவு ஆட்கள் ஏன் தேவை ? தகவல்களை வெச்சு அவ்ளோ விஷயம் நடக்குதா என்ன ? என மனதில் முட்டி மோதும் கேள்விகளுக்குப் பதிலளிக்க வேண்டுமானால் முதலில், டேட்டா சயின்ஸினால் விளைகின்ற நன்மைகள் என்னென்ன என்பதைப் புரிந்து கொள்ள வேண்டும்.

தகவல் அறிவியலின் பயன்பாடு இல்லாத இடம் என்று ஒன்று இனிமேல் இருக்கப் போவதில்லை எனுமளவுக்கு தகவல் அறிவியல் எல்லா இடங்களிலும் நீக்கமற நிறைந்திருக்கப் போகிறது.

உதாரணமாக ஒரு பெரிய சூப்பர் மார்க்கெட்டுக்குப் போகிறீர்கள் என வைத்துக் கொள்ளுங்கள். அங்கே நுழைந்தவுடன் உங்கள் கண்ணுக்குத் தெரியும் விதமாக சில பொருட்கள் இருக்கும். அதாவது கண்பார்வைக்கு நேரான உயரத்தில் !  சில பொருட்கள் கீழே இருக்கும், எளிதில் தட்டுப்படாது. இன்னும் சில பொருட்கள் உயரமான இடத்தில் இருக்கும் பெரியவர்களுக்கு மட்டுமே பார்க்க முடியும். இன்னும் சில பொருட்கள் ‘பில்’ போடும் இடத்துக்கு பக்கத்திலேயே இருக்கும் !  ஏன் இப்படியெல்லாம் அடுக்கி வைக்கிறார்கள் ? என எப்போதாவது யோசித்துப் பார்த்ததுண்டா ?

இவற்றையெல்லாம்  முடிவு செய்வது ‘டேட்டா சயின்ஸ்’ தான் ! ஒரு கடையில் எந்தெந்த பொருட்கள் அதிகமாக விற்பனையாகின்றன ? எந்தெந்த பொருட்கள் குறைவாக விற்பனையாகின்றன ? எந்த பொருட்கள் தவிர்க்க முடியாதவை ? எந்த பொருட்கள் பில் போடும் நேரத்தில் கண்களைக் கவரும் ? என அனைத்து விஷயங்களையும் அலசி ஆராய்ந்து தான் இந்த  அடுக்கி வைக்கும் முறையையே முடிவு செய்கின்றனர். இது வர்த்தகத்தைப் பெருமளவில் அதிகரிக்க உதவுகிறது.

அமெரிக்காவின் பிரபலமான வால்மார்ட் கடைகள் பற்றி உங்களுக்குத் தெரிந்திருக்கும். கடையே அரை கிலோமீட்டர் அளவுக்கு விரிந்து பரந்ததாய் இருக்கக் கூடிய கடைகள் அவை. அவர்கள் டேட்டா சயின்ஸை உதவிக்கு அழைத்து எந்தெந்த பொருட்கள் விற்பனையாகின்றன, எந்தெந்த பொருட்கள் விற்பனை குறைவாக இருக்கின்றன ? போன்ற தகவல்களைத் திரட்டினார்கள். அந்த ஆய்வின் அடிப்படையில் தான் பொருட்களை எங்கே வைக்கவேண்டும், எப்படி வைக்க வேண்டும், எவ்வளவு வைக்க வேண்டும் என்பதைண்டும்யெல்லாம் முடிவு செய்தனர். அதன் பின் அவர்களுடைய வர்த்தகம் வளர்ந்தது !

அதில் ஒரு சுவாரஸ்யமான விஷயத்தைம்யும் கண்டு பிடித்தனர். வெள்ளிக்கிழமைகளில் குழந்தைகளுக்கான டயாப்பர் அதிகமாக விற்பனையானது ! அதென்னடா விஷயம் வெள்ளிக்கிழமை என்பது புரியாத புதிராய் இருந்தது. அதே நாளில் பீர் விற்பனையும் அதிகமாய் இருந்தது ! இரண்டுக்கும் இடையே உள்ள தொடர்பை ஆராய்ந்து பார்த்தால், டயாப்பர் வாங்கும் நபர்களே பீரையும் வாங்குவது தெரிந்தது !  அது எல்லாமே ஆண்கள் தான் என்பதையும் அவர்களுடைய அலசல் காட்டிக் கொடுத்தது. அதன்பின் வால்மார்ட் நிர்வாகம் டயாப்பர் இருக்கும் இடத்துக்கு பக்கத்திலேயே பீர் வகைகளையும் அடுக்கி வைத்தது. இந்த இரண்டு விஷயங்களும் எளிதில் கண்ணுக்குத் தட்டுப்படும் வகையிலும் வைக்கப்பட்டது ! அதன் பின் விற்பனை இன்னும் அதிகரித்தது !

டயாப்பருக்கும், பீருக்கும் என்ன சம்பந்தம் இருக்க முடியும் ? தகவல் அறிவியல் எனும் ஒரு நுட்பம்  இப்படி அலசி ஆராய்ந்து சொன்னால் மட்டுமே இப்படி ஒரு தொடர்பு இருப்பதை அறிய முடியும். இல்லையேல் ஏதோ மொட்டைக்கும் முழங்காலுக்கும் முடிச்சு போடுவது போல சம்பந்தம் இல்லாத விஷயமாகவே தோன்றும்.

அதே போல அமேசான்.காம் உட்பட எந்த ஒரு வர்த்தகத் தளத்துக்குப் போனாலும் ஒரு பொருளை தேடுவீர்கள். உடனே கீழே, அதே போன்ற பல பொருட்களின் தகவல்கள் வரும். இரண்டு பொருட்களைச் சேர்த்து வாங்கினால் தள்ளுபடி விலையில் கிடைக்கும் என வரும். இன்னும் ஒரு படி மேலே போய், நீங்கள் எந்த விலையில் பொருட்களைத் தேடுகிறீகளோ அந்த விலையை ஒட்டிய பொருட்கள் மட்டுமே கண்சிமிட்டும்.  இதன் பின்னணியில் இயங்குவதெல்லாம் டேட்டா சயின்சின் ஏதோ ஒரு அம்சம் தான்.

அப்படியே விளையாட்டுப் பக்கம் போவோம் ! கிரிக்கெட் பார்த்துக் கொண்டிருக்கிறீர்கள் என வைத்துக் கொள்ளுங்கள்.  ரோஹித் ஷர்மா 50 ரன்கள் அடித்தால் உடனே கணினியில் ஏகப்பட்ட புள்ளி விவரங்கள் வரும். ரோஹித் எத்தனை முறை அரை சதம் அடித்திருக்கிறார், யாருக்கு எதிராய் அடித்திருக்கிறார், யாருடைய பார்ட்னர் ஷிப்பில் அடித்திருக்கிறார், எந்தெந்த கிரவுண்டில் அடித்திருக்கிறார், எந்த இன்னிங்சில் அடித்திருக்கிறார், எந்த ஆண்டு அடித்திருக்கிறார், இதே போல யாரெல்லாம் அடித்திருக்கிறார்கள், என நாம் நினைத்துப் பார்க்க முடியாத அளவுக்கு புள்ளி விவரங்களை திணறத் திணற அள்ளித் தெளிப்பார்கள்.

இந்த புள்ளி விவரங்களை வைத்துக் கொண்டு எந்தெந்த களத்தில் எப்படிப்பட்ட ஸ்கோர் அடிக்கப்படலாம், களத்தின் தன்மையைப் பொறுத்து யாரெல்லாம் நன்றாக விளையாடலாம் களத்தின், எந்த பந்து வீச்சாளருக்கு எதிராக ரன்கள் எடுக்கப்படலாம் போன்ற பல விஷயங்களைக் கணிப்பார்கள். விளையாட்டுத் துறையில் நிறைய கணிப்புகளுக்கும், முடிவுகள் எடுப்பதற்கும் இத்தகைய தகவல்களே முதுகெலும்பாய் இருக்கின்றன. இந்த தகவல்களையெல்லாம் அள்ளி அள்ளித் தருவது சாட்சாத் டேட்டா சயின்ஸ் தான்.

விளையாட்டை விட்டு விட்டு மருத்துவப் பகுதியை எட்டிப் பார்த்தால், ஒரு மனிதனுடைய உடல்  ஒரு நாளில் தருகின்ற தகவல்களின் அளவு சுமார் 2 டெரா பைட் என்கிறது தகவல் தொழில்நுட்பம். மனிதனுடைய இதயத் துடிப்பு, இரத்த அழுத்தம், மூச்சு, தூக்கம், நடை என எல்லா விஷயங்களையும் கவனித்து தேவையான ஆலோசனைகளையும், வழிகாட்டுதல்களையும் தரக்கூடிய பல கருவிகளையும், மென்பொருட்களையும் பிரபல நிறுவனங்கள் உருவாக்கியிருக்கின்றன. இப்படி மருத்துவத் துறையில் நோய்களைக் கணிக்கவும், அதன் மூலம் நோய்களின் தாக்கத்தைக் குறைக்கவும், மருத்துவ ஆராய்ச்சிகளை வலுப்படுத்தவும் தகவல் அறிவியல் பயன்படுகிறது.

அதே போல பழைய நுட்பங்களில் இருந்த தவறுகளைத் திருத்திக் கொண்டு,  நோயாளிகளின் நோய்களை கனகட்சிதமாகக் கணிக்க டேட்டா சயின்ஸ் தான் பயன்படுகிறது. தனி நபருடைய மெடிகல் ஹிஸ்டரி, வாழ்க்கைச் சூழல் போன்றவற்றையெல்லாம் அலசி ஆராய முடிவதால் நபருக்கு ஏற்ற மருத்துவம் எனும் தளத்துக்கு மருத்துவ வளர்ச்சி இடம் மாறுகிறது. இனி வரும் காலங்களில் ‘காய்ச்சலுக்கு’ மருந்து எனும் நோய் சார் நிலையிலிருந்து ‘விஜயகுமார்’ க்கு மருந்து எனும் நபர் சார் மருத்துவத்துக்கு மருத்துவத் துறை இடம்பெயரும். அதற்கு டேட்டா சயின்ஸ் தான் துணை செய்யும்.

அப்படியே திரும்பி காப்பீட்டுத் துறைக்குத் தாவினால் அங்கும் டேட்டா சயின்ஸ் கோலோச்சத் துவங்கியிருக்கிறது. கார் இன்சூரன்ஸ் பக்கம் இப்போது பரவி வரும் ‘பே ஹவ் யு டிரைவ்’  எனும் கான்செப்ட் தகவல் அறிவியலின் சிந்தனையில் உருவானதே. அதாவது ஒருவர் கார் ஓட்டுகின்ற ஸ்டைல் எப்படி இருக்கிறது என்பதற்கு ஏற்ப காப்பீடு நிர்ணயிக்கப்படும். அவருடைய காரோட்டும் குணாதிசயத்தை தகவல் அறிவியல் கணித்துச் சொல்கிறது.

ஆளில்லாத கூகிள் கார் கூட டேட்டா சயின்சின் பிள்ளை தான். காரில் இருக்கின்ற பல்வேறு சிக்னல்கள் அள்ளித் தரும் தகவல்களின் அடிப்படையில் கார் பயணிக்கும். இதனால் விபத்துகள் குறையும். ஹெல்த் இன்சூரன்ஸ் பக்கம் போனால் ஒரு மனிதனுடைய உடல் நிலை, அவருடைய உணவுப் பழக்கம், அவருடைய குடிப்பழக்கம், அவருடைய உடற்பயிற்சி, தூக்கம் போன்ற பல்வேறு தகவல்களின் அடிப்படையில் இந்தக்  காப்பீட்டின் மதிப்பு நிர்ணயம் செய்யப்படும்.

வங்கித் துறையை எடுத்துக் கொண்டால் வாடிக்கையாளர்களுடைய தகவல்கள், அவர்களுடைய வங்கிக் கணக்குகள், அவர்கள் பணத்தைச் செலவு செய்யும் முறை என ஏகப்பட்ட விஷயங்களை டேட்டா சயின்ஸ் கணக்கில் கொண்டு வங்கிகளின் தரத்தை உயர்த்துகிறது. வங்கிகளில் நடக்கின்ற மோசடிகளைக் கண்டு பிடிக்கவும், வாடிக்கையாளர்களை வசீகரிக்கும் திட்டங்களை உருவாக்கவும் டேட்டா சயின்ஸ் கை கொடுக்கிறது.

இப்படி எந்த ஒரு துறையை எடுத்தாலும் தகவல் அறிவியல் தான் அதன் மையமாக நின்று செயல்படுகிறது. இதன் பல்வேறு அம்சங்கள் தான் மெஷின் லேர்னிங், பிக் டேட்டா, டேட்டா மைனிங் என பல பெயர்களில் உலா வருகிறது. இது தான் டேட்டா சயின்ஸ் துறை அதன் ஸ்பெஷலிஸ்ட்களை வலை வீசித் தேடிக்கொண்டிருக்கக் காரணம்.

இந்தத் துறைக்கு நுழைய என்னென்ன தெரிந்திருக்க வேண்டும் ?

( தொடர்வோம் )