Data Science 8 : தகவல் அறிவியல் 8

எதிர்காலத்தில் தகவல் அறிவியல்

Image result for data science

எந்த ஒரு தொழில்நுட்பமும் கல்வெட்டு போல நிலைத்து நிற்பதில்லை. நாட்கள் செல்லச் செல்ல அந்த நுட்பம் தனது முக்கியத்துவம் இழந்து விடுகிறது. அப்போது இன்னொரு தொழில்நுட்பம் அந்த இடத்தை ஆக்கிரமித்துக்  கொள்ளும். அதுவும் இன்றைய டிஜிடல் யுகத்தில் தொழில்நுட்பத்தின் மாற்றங்கள் எக்ஸ்பிரஸ் வேகத்தில் தான் நிகழ்கின்றன.

தகவல் அறிவியல் தொழில்நுட்பமும் அப்படித் தான் இன்று இருப்பதைப் போலவே எல்லா நாளும் இருக்கப் போவதில்லை. மாற்றங்களை நிச்சயமாகச் சந்திக்கப் போகிறது, புதிய புதிய வடிவங்களை எடுக்கப் போகிறது. புதிய புதிய தொழில்நுட்பங்களோடு தன்னை இணைத்துக் கொள்ளப் போகிறது.

ஆர்டிஃபிஷியல் இன்டலிஜென்ஸ் எனப்படும் செயற்கை அறிவு அதில் முக்கியமான ஒன்று. அது கண்டிப்பாக இன்னும் ஆழமாக தகவல் அறிவியல் துறைக்குள் நுழையும் என்பதில் சந்தேகமில்லை. அப்போது அல்காரிதங்களும், மென்பொருட்களும் தன்னிலே “ஸ்மார்ட்” ஆக மாறி தகவல்களை பயன்படுத்தத் துவங்கிவிடும். மனித உதவி தேவையில்லாமலேயே பின்னர் ‘பிரடிக்டிவ்’ அலசல்கள் நடக்க வாய்ப்புகள் அதிகம்.

ஆர்டிபிஷியல் இன்டெலிஜென்டின் வரவு தகவல் அறிவியலில் ஏற்படுத்துகின்ற விளைவுகளில் ஒரு எதிர் விளைவும் உண்டு. எப்போது செயற்கை அறிவு முழுமையாக தகவல் அறிவியலில் நுழைகிறதோ அப்போது மனித உழைப்புக்கு அங்கே வேலை குறைகிறது. ஆட்டோமேஷன் அந்த இடத்தை வந்தடைகிறது. இதனால் அந்த காலகட்டத்தில் வேலை வாய்ப்புகள் குறையும். ஆனால் அதுவரை தகவல் அறிவியலார்களுக்கான தேவை அதிகரித்துக் கொண்டே இருக்கும்.

அதே போல மெஷின் லேர்னிங் எனப்படும் தொழில்நுட்பமும் இன்னும் அதிகமாக தகவல் அறிவியலில் இணைந்து கொள்ளும். ஏற்கனவே மெஷின் லேர்னிங் நுட்பம் டேட்டா சயின்ஸோடு இணைந்து தான் பயணிக்கிறது. இனிமேல்  இன்னும் அதிகமாக அந்த பிணைப்பு இருக்கும்.

உதாரணமாக ஒரு இயந்திரம் தனது தகவலை இன்னொரு இயந்திரத்துக்கு தானாகவே அனுப்பும், ஒரு கருவி வேறு பல கருவிகளிலிருந்து வருகின்ற தகவல்களை தானாகவே சேகரித்து அலசலை துவங்கும். சென்சார்களின் தகவல்கள் அங்கும் இங்கும் தானாகவே கூடு விட்டுக் கூடு பாய்ந்து தனது பணிகளைச் செய்யும். என இந்த மெஷின் லேர்னிங் நுட்பம் தகவல் அறிவியலில் வெகு ஆழமாய் செல்லும் என்பதில் சந்தேகமே இல்லை.

மருத்துவத் துறையில் தகவல் அறிவியலின் பயன் இன்னும் பல மடங்கு அதிகரிக்கப் போகிறது. குறிப்பாக நியூரல் நெட்வர்க் எனும் நரம்பியல் துறையில் தகவல் அறிவியலின் பயன்பாடு வெகுவாக அதிகரிக்கும் என மருத்துவ அறிக்கைகளும், ஆய்வுகளும் தெரிவிக்கின்றன.  மருத்துவம் ஏற்கனவே தகவல் அறிவியலை ஆய்வுகளிலும், மருத்துவமனைகளிலும் பயன்படுத்தி வருகிறது. அது இன்னும் பலமடங்கு அதிகரிக்கும்.

இன்டர்நெட் ஆஃப் திங்க்ஸ் எனும் தொழில்நுட்பம் பற்றி கேள்விப்பட்டிருப்பீர்கள். இப்போது கணினி துறையில் படிப்பவர்களுக்கு இது ஒரு கட்டாயப் பாடமாகவும் இருக்கிறது. எப்படி இணையத்தில் தகவல்களை சேமிக்கிறோமோ, அப்படி உலகில் நாம் பயன்படுத்தும் பல்வேறு பொருட்களையும் இணையத்தோடு இணைப்பது தான் இதன் அடிப்படை சிந்தனை. உதாரணமாக உங்கள் வீட்டு கேஸ் ஸடவ்வை நீங்கள் இணையத்தோடு இணைக்கலாம். அது ஒழுங்காக வேலை செய்கிறதா என்பதைக் கவனிக்கலாம்.

இவற்றையெல்லாம் சென்சார்கள் கவனித்துக் கொள்கின்றன. டிஜிடல் தகவல்களை அவை கணினிகளுக்கோ, அல்லது அது போன்ற கருவிகளுக்கோ அனுப்பி இணைய உலகோடுள்ள உறவை உயிர்ப்பித்துக் கொள்கின்றன. இன்றைக்கு சுமார் 170 பில்லியன் எனுமளவில் இருக்கும் இன்டர்நெட் ஆஃப் திங்க்ஸ் பிஸினஸ் இன்னும் நான்கு ஆண்டுகளில் சுமார் 560 பில்லியன் எனுமளவுக்கு எகிறும் என்கின்றன ஆய்வுகள்.

அதே போல பிக் டேட்டா எனும் தொழில்நுட்பமும் தகவல் அறிவியலின் ஒரு பாகம் தான். பிக் டேட்டா என்பது உங்களுக்குத்  தெரிந்த விஷயம் தான். கொட்டிக் கிடக்கின்ற கணக்கற்ற தகவல்களை எப்படி பயனுள்ள தகவல்களாக மாற்றுகிறோம் ? எப்படி அவற்றைக் கொண்டு தொழிலை வளர்ச்சிப் பாதையில் அழைத்துச் செல்கிறோம் என்பது தான் அதன் அடிப்படை. முழுக்க முழுக்க தகவல்களின் அடிப்படையில் இயங்குவதால் இது தொடர்ந்து தகவல் அறிவியலில் ஒரு முக்கியமான பாகமாக இருக்கும் !

வெறும் எண்களையும், டிஜிடல் எழுத்துகளையும் வைத்து தான் இன்றைக்கு தகவல் அறிவியல் அசத்திக் கொண்டிருக்கிறது. மற்றெந்த வகை தகவல்களாய் இருந்தாலும் அவற்றை முதலில் டிஜிடல் எண்களாகவோ, எழுத்துகளாகவோ மாற்றினால் தான் பயன்பாட்டுக்குக் கொண்டு வர முடியும் எனும் சூழல் இருக்கிறது. இந்த நிலை மாறும் !  இனி வரும் காலங்களில் தகவல்களை டிஜிடல் எண்களாக மாற்றாமல் நேரடியாகவே பயன்படுத்தக் கூடிய நுட்பங்கள் உருவாகும்.

அப்படிப்பட்ட மாற்றம் வரும்போது தகவல் அறிவியலில் இன்னும் வியப்பூட்டும் விஷயங்கள் நடக்கும். ஆடியோக்கள், வீடியோக்கள், புகைப்படங்கள், லைவ் கேமராக்கள் போன்றவை எல்லாமே மிகப்பெரிய நேரடியான உள்ளீடு தகவல்களாக பயன்படும். தகவல் அறிவியலின் மிகப்பெரிய புரட்சி அது என சொல்லலாம்.

அத்துடன் ‘நேட்டிவ் லேங்குவேஜ்’ எனப்படும் மொழிகடந்த தகவல் அறிவியலும் உருவாகிவிட்டால் இதன் வீச்சு கணிக்க முடியாத அளவுக்கு இருக்கும்.

ஹைப்பர் பெர்சனலைசேஷன் எனப்படும் தனிமனிதனை மையப்படுத்தி செய்கின்ற தொழில்களுக்கு தகவல் அறிவியல் தான் மிகப்பெரிய துணையாய் இருக்கப் போகிறது. விற்பனையாளருக்கும், வாடிக்கையாளருக்கும் இடையேயான தொடர்பை இறுக்கிப் பிடித்து விற்பனையை உறுதி செய்வதில் இந்த பெர்சனலைசேஷன் சிந்தனை தேவையானதாய் இருக்கிறது.

ஆகுமென்டட் ரியாலிடி எனும் தொழில்நுட்பத்தில் ஏற்படுகின்ற மாற்றங்களும் தகவல் அறிவியலின் வளர்ச்சியைக் கொண்டு வரும். ஆகுமென்டர் ரியாலிடி இன்றைக்கு ‘கேம்ஸ்’ துறையில் கொண்டு வந்திருக்கின்ற மாற்றங்கள் எக்கச்சக்கம். அப்படியே அந்த நுட்பத்தை ஸ்மார்ட் போனில் மாற்றுகின்ற நடைமுறையும் இப்போது வரத் துவங்கியிருக்கிறது. ஆகுமென்டட் ரியாலிடி வளர வளர, டேட்டா சயின்ஸும் வளரும்.

பிகேவியரல் அனாலிசிஸ் எனப்படும், ஒரு மனிதனுடைய குணாதிசயங்களை அலசுகின்ற, உளவியல் சார்ந்த தகவல் அறிவியலும் இப்போது வளர்ந்து வருகிறது. பயனாளர்களை உளவியல் ரீதியாக அணுகும் முறை இது என்றும் சொல்லலாம். எந்த அளவுக்கு ஒரு நபரைத் தெரிந்து வைத்திருக்கிறோமோ, அந்த அளவுக்கு அவருடைய தேவைகளை அறிந்து கொள்ள முடியும் எனும் அடிப்படை விஷயம் தான் இங்கே கையாளப்படுகிறது.

தகவல் அறிவியலில் வளர்ச்சியும், ஆர்டிபிஷியல் இன்டெலிஜென்ட் வளர்ச்சியும் இயந்திரங்களையும், கருவிகளையும் ஸ்மார்ட் ஆக மாற்றிக் கொண்டிருக்கின்றன. இனிமேல் அந்த கருவிகளெல்லாம் அறிவைத் தாண்டி ஞானம் உடையவையாக மாறும் என்பதே தொழில்நுட்பம் தருகின்ற தொலை நோக்குப் பார்வை. நமது பிள்ளைகளுக்கு நாம் அறிவைக் கொடுக்கும் முன்பே நல்ல சிந்தனைகளையும், பகுத்தறிவையும் கொடுக்கிறோம் இல்லையா ? அதே போல நமது  இயந்திரங்களும் ஞானம் கொண்டவையாய், சுய சிந்தனை கொண்டவையாய் மாறும் என்பதே தகவல் அறிவியலின் சிந்தனை.

சுருக்கமாகச் சொல்லவேண்டுமெனில், தகவல் அறிவியலின் வீச்சும் பயன்பாடும் அடுத்த ஐந்து பத்து ஆண்டுகளுக்கு நிற்கப் போவதில்லை. வடிவம் மாறி, நுட்பம் மாறி பயணித்துக் கொண்டே தான் இருக்கப் போகிறது. எனவே ஆர்வமும், திறமையும் உடையவர்கள் தயங்காமல் இந்தத் துறையை அரவணைத்துக் கொள்ளலாம்

( முற்றும் )

Advertisements

Data Science 7 :

Image result for data science

 

அமெரிக்காவுக்கு மட்டுமே இந்த ஆண்டு இறுதிக்குள் இரண்டு இலட்சம் டேட்டா சயின்ஸ் பொறியாளர்கள் தேவைப்படுவார்கள் என்கிறது மெக்கன்சி ஆய்வு. அடுத்த பத்து ஆண்டுகளுக்கு தொழில் நுட்ப உலகை வசீகரிக்கப் போகும் வேலை இந்த தகவல் அறிவியல் தான் கூகிள் நிறுவன தலைமை பொருளாதார அதிகாரி ஹான் வாரியன். தகவல் அறிவியல் எனும் துறை இப்போதே பெரும்பாலான நிறுவனங்களின் முதுகெலும்பாகத் தான் இருக்கிறது. அப்படி வசீகரிக்கும் நிறுவனங்களில் மூன்று நிறுவனங்களைப் பற்றி நாம் கடைசியில் பார்ப்போம் !

‘இந்த தகவலை எல்லாம் வெச்சு என்ன செய்ய போறோம்” என்கிற மனநிலை ஒரு காலத்தில் இருந்தது. இப்போது அது தலைகீழாக மாறிவிட்டது. எந்த தகவலை வைத்தும் என்ன வேண்டுமானாலும் செய்யலாம் எனும் சிந்தனை உருவாகிவிட்டது. தகவல் என்பது பொன்முட்டையிடும் வாத்தாக மாறிவிட்டது. தகவல் என்பது பணம் காய்க்கும் மரமாகிவிட்டது. அதனால் தான் எல்லா மென்பொருட்களும், நிறுவனங்களும் தகவல் சேகரிப்பில் ஆர்வம் காட்டுகின்றன. அது பல வேளைகளில் தனி மனித சுதந்திரத்துக்கு வேட்டு வைப்பதாகவும் அமைந்து விடுகிறது என்பது தனிக்கதை.

எனவே இப்போதெல்லாம் நிறுவனங்கள் தங்கள் அடிப்படை சிந்தனையாக எழுதிக் கொள்ளும் விஷயம் இது தான், “தகவல்கள் எல்லாமே ஏதோ ஒரு வகையில் தேவையானவை”. ஒரு தகவலை சாதாரணமான ஒரு எண்ணாகவோ, எழுத்தாகவோ பார்க்காமல் அதன் பின்னணியில் இயங்குகின்ற விஷயங்களை ஊகித்து அறிவதிலும், கணித்து கண்டுபிடிப்பதிலும் இருக்கிறது தகவல் அறிவியலின் முதல் வெற்றி.

தகவல்களுக்கு எடை உண்டு ! தகவல்கள் காற்றைப் போல அங்கும் இங்கும் அலைந்து திரிந்தாலும் அதை சரியான வகையில் கட்டுப்படுத்தி கட்டி வைப்பவர்களுக்கு அது செல்வத்தை அள்ளித் தருகிறது. காற்றிலிருந்தும் தகவலை சேகரிப்பது தகவல் அறிவியலின் தேவை. அதாவது, யாருக்கும் தேவையில்லை என நினைக்கும் விஷயங்கள் ஒரு நிறுவனத்தின் வளர்ச்சியையே ஒட்டு மொத்தமாய்ப் புரட்டிப் போட முடியும்.

இப்போது இன்னொரு சிந்தனை வேண்டும். “நம்மிடம் இருக்கின்ற பிரச்சினை இன்னது.. இதை எப்படி நம்மிடம் இருக்கின்ற தகவலோடு இணைத்து முடிச்சுப் போடுவது ? இதற்குத் தான் மென்பொருட்களும், அல்காரிதங்களும் உதவிக்கு வருகின்றன. ஆனால் ஒரு சாதாரண நபராக ஒரு பிரச்சினையையும், அதை எப்படி இந்தத் தகவல் தீர்த்து வைக்கலாம் எனும் சிந்தனையும் இருக்க வேண்டியது அவசியம்.

இப்போது அடுத்த நிலை ! தகவலைப் புரிந்து கொண்டாயிற்று. அதை எப்படி பிரச்சினையோடு இணைத்து முடிவை நோக்கி நகர்வது என்பதையும் அறிந்தாயிற்று. அதைச் செயல்படுத்தக்கூடிய கட்டமைப்பு நிறுவனத்துக்கு இருக்கிறதா ? என்பதைப் பார்க்க வேண்டும். வண்டி நுழையாத தெருவுக்குள் வீட்டை கட்டி வைத்தால், பென்ஸ் கார் வாங்கினாலும் பயனில்லை அல்லவா ? எனவே செயல்படுத்தப் பட வேண்டிய கட்டமைப்பை உருவாக்குவதும், சரியான நேரத்தில் அதை செயல்படுத்துவதும் அவசியம்.

எதிர்காலத்தில் இந்த தகவல் அறிவியல் என்பது , ‘ரியல் டைம் டேட்டா’ அதாவது தகவல்கள் வர வர அதை வைத்து ஆட்டோமெடிக்காக அலசி முடிவுகள் எடுக்கும் முறை வந்து விடும். இப்போதைக்கு இருக்கின்ற தகவல்களைக் குவித்து, அதை அலசி தான் முடிவுகளை எடுக்கிறோம். அதன் பின் வருகின்ற அதிகபடியான தகவல்கள் ஆட்டோமெடிக்காக பயன்படுத்தப்படும் சூழல் உருவாகும்.

இப்போது தகவல் அறிவியல் துறையில் கோலோச்சிக் கொண்டிருக்கும் டாப் 3 நிறுவனங்களைப் பற்றி பார்க்கலாம்.

1. கூகிள் !

நம்மை ரகசியக் கண் கொண்டு பார்த்துக் கொண்டே இருக்கும் நிறுவனம் என நீங்கள் கூகிளை சொல்லலாம். ஜிமெயிலில் நீங்கள் அனுப்புகின்ற ஒவ்வொரு மெயிலும் வாசிக்கப்படலாம், பிக் டேட்டா அனாலிசிஸ் செய்யப்படலாம், அந்தத் தகவல்களை பிஸினஸ் தேவைக்காய் பயன்படுத்தலாம்.

உதாரணமாக, நீங்கள் ஒரு விமான டிக்கெட் புக் செய்கிறீர்கள். அதை கூகிள் மெயிலுக்கு அனுப்புகிறீர்கள் என வைத்துக் கொள்ளுங்கள். அது அந்தத் தகவல்களையெல்லாம் படித்து விட்டு, அங்கே அந்த நாளில் உங்களுக்கு ஹோட்டல் வேண்டுமா, கார் வேண்டுமா, வேறு ஏதாவது வசதிகள் வேண்டுமா என டிஜிடல் நச்சரிப்பை ஆரம்பிக்கும்.

எதற்கெடுத்தாலும் நாம் கூகிளைத் தான் அழைத்து, ‘தேடுதல்’ செய்கிறோம் இல்லையா ? அந்த தகவல்களெல்லாம் அவர்களுடைய சர்வரைக் கடந்து தான் செல்கின்றன. அவற்றில் எவையெல்லாம் தேவைப்படுமோ அவற்றையெல்லாம் கூகிள் சேமித்துக் கொள்கிறது. இன்னும் சொல்லப்போனால், தனது நிறுவனத்தில் பணிசெய்யும் ஊழியர்களுக்கு என்ன கொடுத்தால் குஷியாவார்கள் என்பதையும் இந்த தகவல் அறிவியல் கண்டறிந்து சொல்கிறது.

நீங்கள் யூடியூபில் பார்க்கின்ற வீடியோக்கள் அடிப்படையில் உங்களுக்கு புதிய வீடியோக்களை அறிமுகம் செய்கிறது. அதன்பின் இப்படிப்பட்ட வீடியோ பார்ப்பவர்கள் வேறென்ன பார்க்கலாம் என்பதைக் கணிக்கிறது. எத்தனை முறை பார்க்கிறார்கள் என்பதை வைத்து அவர்களை எடை போடுகிறது. எந்த நேரத்தில் எந்த வீடியோவைப் பார்ப்பவர்கள் என்ன குணாதிசயம் கொண்டவர்கள் என்பதை அல்காரிதம் மூலம் சேமிக்கிறது. அதன் அடிப்படையில் விளம்பரங்களோ, வசீகரங்களோ தந்து வலையில் வீழ்த்துகிறது.

2. அமேசான் !

அமேசான் நிறுவனத்தைப் பற்றி சொல்லவேண்டாம். ஆன்லைன் ஷாப்பிங் செய்த எல்லோருக்குமே அந்த அனுபவம் நிச்சயம் இருக்கும். ஒரு பொருளை வாங்க அந்தத் தளத்துக்குப் போனாலே உங்களை வரவேற்று உங்களுக்குத் தேவையானவற்றைத் தந்து உங்களை ஈர்த்துக் கொண்டே இருக்கும்.

உங்களுடைய தேடுதல் பேட்டர்ன், உங்களுடைய பர்சேஸ் பேட்டர்ன் போன்றவற்றையெல்லாம் வைத்து நீங்கள் ஒரு பொருளை வாங்குவீர்களா, மாட்டீர்களா என்பதை அது கணிக்கும். உங்களுடைய வாங்கும் திறமைக்குத் தக்க பொருட்களை மட்டுமே அது உங்களுக்கு பரிந்துரை செய்யும். மாருதி கார் வாங்கும் அளவுக்கு வசதி மட்டுமே உடையவர்களுக்கு அது ஆடி காரை பரிந்துரை செய்யாது. அந்த அளவுக்கு அதை அறிவுசார் மென்பொருளாய் மாறியிருக்கிறது. அதன் காரணஅது ம் ஆர்டிபிஷியல் இன்டலிஜென்ஸ் கலந்த பிக் டேட்டா என்பதில் சந்தேகமில்லை.

அது இன்னும் ஒரு படி மேலே போய், நீங்கள் ஒரு பொருளை வாங்குவீர்களா இல்லையா என்பதைக் கணித்து, வாங்குவீர்கள் என மென்பொருளின் அல்காரிதம் சொன்னால் அந்தப் பொருளை அடுத்திருக்கும் ஒரு கடைக்கோ, கோடவுனுக்கோ அது அனுப்பவும் செய்கிறது. இப்படி தனது வளர்ச்சியின் முதுகெலும்பாய் தகவல் அறிவியலைத் தான் கட்டி வைத்திருக்கிறது.

3, ஃபேஸ் புக் !

பேஸ்புக் தகவல் அறிவியலில் ஒரு மிகப்பெரிய உயரத்தை எட்டிய கம்பெனி. இந்த நிறுவனத்தின் பாசிடிவ் விஷயம் என்னவென்றால், அவர்களிடம் எக்கச்சக்க தகவல்கள் இருக்கின்றன என்பது தான். ஒன்றிரண்டு அல்ல, அவர்களிடம் சுமார் 220 கோடி பேருடைய தகவல்கள் இருக்கின்றன. எல்லாமே தனிப்பட்ட தகவல்கள். இவற்றை வைத்துக் கொண்டு உங்களுடைய தேவைகளையெல்லாம் அது அறிந்து கொள்ளும்.

அப்படியே உங்களோடு தொடர்பில் இருப்பவர்களைப் பார்த்து, யாரையெல்லாம் வசீகரிக்கலாம். என்னென்ன பொருட்களை விற்கலாம். என்பதையெல்லாம் கணக்கு போடும். விளம்பரங்களின் மூலம் மிகப்பெரிய லாபத்தை அடைகின்ற நிறுவனங்களில் ஒன்று பேஸ்புக் என்பதில் சந்தேகமேயில்லை.

இவையெல்லாம் நமக்குத் தெரிந்த பெரிய கம்பெனிகள். அதற்காக அவை மட்டும் தான் இந்த தகவல் அறிவியல் துறையில் கோலோச்சும் நிறுவனங்கள் என்பதில்லை. சின்னச் சின்ன நிறுவனங்கள் கூட தகவல் அறிவியலை தங்களுடைய பிஸினஸ் வளர்ச்சிக்குப் பயன்படுத்துகின்றன.

“சரி பண்றவன் பண்ணிட்டு போறான்”, என நிறுவனங்கள் அலட்சியமாய் இருந்து விடவும் முடியாது. பொம்மலாட்டக் குதிரையை ரேஸ் டிராக்கில் விட்டது போல ஆபத்தாகிவிடும். விரைவிலேயே பிஸினஸை மூட்டை கட்டி வைப்பதைத் தவிர வேறு வழி இல்லை என்றாகிவிடும்.

தகவல் அறிவியலின் சிந்தனை கொஞ்சம் பழையதாய் இருந்தாலும், இன்றைய தொழில்நுட்பம் அதை மிகப்பெரிய உயரத்துக்கு எடுத்துச் சென்றிருக்கிறது. அதனால் தான் இன்றைக்கு தகவல் அறிவியல் பொறியாளர்களின் தேவை முன்பெப்போதும் இல்லாத அளவுக்கு எகிறியிருக்கிறது.

Data Science 5 : தகவல் அறிவியல் 5

Image result for data science

கடந்த வாரங்களில் தகவல் அறிவியல் என்றால் என்ன என்பதைப் பற்றியும், அதன் பயன்கள் பற்றியும், அந்தத் துறையில் உள்ள பல்வேறு வேலை வாய்ப்பு விஷயங்கள் பற்றியும் பார்த்தோம். இந்த வாரம் தகவல் அறிவியல் துறைக்குள் நுழைந்து அங்கே அப்படி என்ன தான் வேலை செய்கிறார்கள் என்பதை எட்டிப் பார்க்கப் போகிறோம் !

அப்படி தகவல் அறிவியல் துறையில் என்ன வேலை தான் செய்கிறார்கள் ?

1. பிரச்சினையை புரிதல் !

தகவல் அறிவியலின் ஆகப் பெரிய விஷயமே ஒரு நிறுவனத்தின் பிரச்சினை என்ன என்பதைப் புரிந்து கொள்வது. பிரச்சினை என்ன என்பதைப் புரிந்து கொள்வது என்பது இரண்டு நிலை கொண்டது. ஒன்று ‘இது தான் என்னோட பிரச்சினை’ என முன்வைப்பது. இரண்டாவது, ‘இந்த பிரச்சினை இல்லாமல் எனக்கு இப்படிப்பட்ட ஒரு நிலை வேண்டும்’ என்பது !

ஒரு பிரச்சினையை அக்கு வேறு ஆணி வேறாகப் புரிந்து கொள்வது தகவல் அறிவியலில் மிக முக்கியம். அதற்கு ஏகப்பட்ட கேள்விகளைக் கேட்க வேண்டும். கேள்விகள் பிரச்சினைகளை அதிகப்படுத்தி, அதிலுள்ள அடிப்பட்ட விஷயங்கள் வரை வெளிக்கொணரும். எந்த அளவுக்கு பிரச்சினையை பிரச்சினையைப் புரிந்து கொள்கிறோமோ, அந்த அளவுக்கு தெளிவான தீர்வுகள் கிடைக்கும். பிரச்சினையைப் புரிந்து கொள்ளாமல் களத்தில் இறங்குவது தவகல் அறிவியல் துறையைப் பொறுத்தவரை மிகப்பெரிய பிழை.

உதாரணமாக, “நிறைய கஸ்டமர்களை ஈர்க்க வேண்டும்” என்பது ஒரு வரி தேவையாக இருக்கலாம். அதை வைத்துக் கொண்டு தகவல் அறிவியலில் எதுவும் செய்ய முடியாது. நீங்கள் என்ன செய்கிறீர்கள், எப்படிப்பட்ட கஸ்டமர்கள் வேண்டும், யாரெல்லாம் போட்டியாளர்கள்,அவர்களிடம் எவ்வளவு கஸ்டம்ர்கள் இருக்கிறார்கள், உங்கள் கஸ்டமர்களின் விமர்சனங்கள் என்ன ? குறைகள் என்ன ? எவ்வளவு நாட்கள் சராசரியாக உங்களோடு இருக்கிறார்கள் என தொடங்கி நூற்றுக்கணக்கான கேள்விகளை வரிசையாக எழுப்பினால் உங்களுக்கு கொஞ்சம் கொஞ்சமாக விஷயம் புரியத் துவங்கும்.

எந்த அளவுக்கு கேள்விகளைக் கேட்கிறீர்கள், எந்த அளவுக்கு தொடர்புடைய கேள்விகளைக் கேட்கிறீர்கள் என்பதை வைத்து உங்களுடைய முடிவுகளுக்கு தெளிவு கிடைக்கும். சில கேள்விகள் தான் மாற்றங்களைக் கொண்டு வரும். நிறுவனமே யோசிக்காத விஷயங்களை யோசிக்கத் துவங்குவதும் அப்போது தான். பிரச்சினையை புரிந்து கொள்வதற்கான ‘பிரெயின் ஸ்டாமிங்’ என இந்த விவாதத்தை அழைப்பதுண்டு.

2. தகவல் சேகரிப்பு

பெயரைக் கேட்டாலே புரிஞ்சிருக்குமே ! இருக்கின்ற தகவல்களையெல்லாம் சேகரிப்பது தான் இந்தக் கட்டம். ஆனால் அது நாம் நினைப்பது போல எளிதல்ல. தகவல்கள் எப்போதும் ஒரு நாலு ஃபைல்களில் இருப்பதில்லை. தகவல்கள் எங்கே இருக்கின்றன என்பதைக் கண்டுபிடிக்கவே நிறைய தகவல்கள் தேவைப்படும். அந்த தகவல்களைக் கண்டுபிடித்தபின் அதைச் சேகரிக்க வேண்டும்.

முதலில் வகைப்படுத்தப்பட்ட தகவல்கள் என்னென்ன இருக்கின்றன என்பதைக் கண்டுபிடித்து அவற்றை சேகரிக்க வேண்டும். இது எளிதான பணி. அதிக பயனளிக்கக் கூடிய தகவலும் இது தான். ஆனால் இது மட்டுமே முழுமையான தகவல் அல்ல. உதாரணமாக அலுவலக டேட்டாபேஸை எடுத்து அதிலுள்ள தகவல்களை இழுத்தெடுப்பது ! நிறைய பயனுள்ள தகவல்கள் கிடைக்கும்.

பின்பு நிறுவனம் சார்ந்த மற்ற இடங்களில் இருக்கின்ற தகவல்களை சேகரிக்க வேண்டும். உதாரணமாக அது ஒரு வலைத்தளமாக இருக்கலாம். நிறுவனத்தின் இன்ட்ரா நெட் எனப்படும் பாதுகாப்பான தனி வலைத்தளமாக இருக்கலாம். அவற்றையெல்லாம் சேகரிப்பது கொஞ்சம் கஷ்டமான பணி.

அடுத்தது அலுவலகத்திலுள்ள தகவல்களில் வகைப்படுத்தப்படாத தகவல்களைச் சேகரிப்பது. தலைவலியான வேலை என இதைச் சொல்லலாம். வகைப்படுத்தாத தகவல் எப்படி வேண்டுமானாலும் இருக்கலாம். ஒரு வீடியோவாகவோ, ஆடியோவாகவோ, ஒரு கிறுக்கல் கையெழுத்தாகவோ, ஒரு வாய்ச்சொல்லாகவோ எப்படி வேண்டுமானாலும் இருக்கலாம். அவையும் சேகரிக்கப்பட வேண்டும். அப்போது தான் முழுமையான ஒரு தீர்வுக்குள் செல்ல முடியும்.

தகவல்களைச் சேகரிக்கும் போது, முதல் கட்டத்தில் நாம் ஏகப்பட்ட கேள்விகளைக் கேட்டோமல்லவா ? அந்த அத்தனை கேள்விகளுக்குமான விடைகள் வந்திருக்கின்றனவா என்பதை பரிசீலனை செய்ய வேண்டும். புதிதாக கேள்விகள் கேட்க வேண்டிய தேவையிருந்தால் கேட்கலாம். இந்த கட்டம் மிக முக்கியமான கட்டம். இதில் தவற விடுகின்ற முக்கியமான தகவல்கள் நிறுவனத்தின் முடிவுகளை பெரிய அளவில் பாதிக்க வாய்ப்பு உண்டு.

3. தகவல் செயல்முறை

தகவல் அறிவியலின் முதுகெலும்பு என்பது தகவல் செயல்முறை அதாவது டேட்டா புராசசிங். பிரச்சினையைப் புரிந்து கொள்வதும், தகவல்களை சேகரிப்பதும் எந்த அளவுக்கு சிறப்பாக நடந்திருக்கிறது என்பதை வைத்து தான் இந்த செயல்முறைப் பகுதி வெற்றியடையுமா தோல்வியடையுமா என்பதைச் சொல்ல முடியும்.

தகவல் செயல்முறைக்கு முன்பு இருக்கின்ற ஒரு வேலை தகவல்களை தூசு தட்டி துடைத்து எடுப்பதும். தேவையற்ற தகவல்களை உடைத்து எறிவதும் தான். அந்த வேலைக்காகத் தான் பெரும்பாலான நேரத்தை தகவல் அறிவியலார்கள் செலவிடுவார்கள். சுமார் 70 முதல் 80 சதவீதம் நேரம் தேவையற்ற தகவல்களை நீக்குவதில் செலவாகும் என்கிறது ஒரு ஆய்வு.

தேவையற்ற ஒரு தகவல், முடிவில் மிகப்பெரிய மாற்றத்தை உருவாக்கி விடக்கூடும். எனவே தான் தேவையற்ற தகவல்களை அகற்ற வேண்டியது அவசியாகிறது. எல்லா பாடத்துக்கும் தோற்றுப் போகும் ஒரு மாணவனுக்கு, கணிதத்தில் 400 மதிப்பெண் என தவறாகப் பதிவாகியிருந்தால் மொத்த சதவீதத்தில் அவன் பெயர் முன்னணியில் வருமில்லையா ? அதே போல நினைத்துக் கொள்ளுங்கள்.

இந்த இடத்தில் மென்பொருட்கள் உதவிக்கு வரும். இருக்கின்ற தகவல்களை நாம் அப்படியே எதுவும் செய்து விட முடியாது. அதை அலச, அதை வைத்து உருப்படியாய் ஏதாவது செய்ய கணினியின் உதவி மிக மிக அவசியம். பைத்தான் , ஆர் போன்ற மென்பொருட்கள் இந்த இடத்தில் மிகப்பெரிய உதவியாய் இருக்கும்.

4. தகவல் ஆராய்ச்சி

இப்போது கைவசம் இருப்பவை நல்ல தகவல்கள். முறைப்படுத்தப்பட்ட தகவல்கள். இவற்றை வைத்துக் கொண்டு எப்படியெல்லாம் வித்தை காட்டலாம் என்பது தான் தகவல் அறிவியலின் ஒட்டு மொத்த விஷயம்.

இந்த தகவல்களை அலசி, ஆராய்ந்து, தொடர்புகளைக் கண்டறிந்து அதன்’பேட்டர்ன்’ அதாவது முறைகளை அறிந்து, அதைக் கொண்டு நிறுவனத்துக்குத் தேவையான தீர்வுகளை உருவாக்கும் இடம் இது தான்.

இங்கே எப்படி தகவலை நாம் காட்சிப்படுத்திப் பார்க்கிறோம், மனதுக்குள் படமாக விரித்துப் பார்க்கிறோம் என்பது மிக முக்கியம். அது தான் நிறுவனத்திற்குத் தேவையான தீர்வுகளை நோக்கி வழிநடத்தும்.

இந்த அலசலில் கிடைக்கின்ற தகவல்களை, பேட்டர்ன்களை வைத்து தான் ஆழமான அலசல் செய்ய முடியும். ஆழமன அலசலுக்குள் நுழைவதற்கு முன் தகவல்களை எப்படியெல்லாம் பயன்படுத்தலாம் என்பது குறித்த ஒரு பார்வை இருக்க வேண்டும். இந்த கட்டம் அதைத் தான் தரும்.

5. ஆழமான அலசல்

இந்த கட்டத்தில் தான் கண்டறிந்த தகவல்களை வைத்துக் கொண்டு நிறுவனம் எதிர்பார்க்கின்ற மாடலை உருவாக்கும் வேலை நடைபெறும். இந்த தகவல்களை எப்படிப் பயன்படுத்தினால் எப்படிப்பட்ட பயன்கள் கிடைக்கும் என்பதைக் கணிக்கும் ‘பிரடிக்டிவ் மாடல்’ உருவாவது இப்போது தான்.

இந்த இடத்தில் மீண்டும் சில கேள்விகளை எழுப்ப வேண்டும் ! நான் என்ன மாடலை கணிக்கப் போகிறேன். எனது நோக்கம் என்ன ? அது தான் நிறுவனம் எதிர்பார்க்கின்ற விஷயமா ? நிறுவனத்தின் நோக்கத்தோடும், எதிர்பார்ப்போடும் நான் ஒத்துப் போகிறேனா ? என்பதையெல்லாம் கேள்விகள் மூலம் உறுதி செய்து கொள்ள வேண்டியது முக்கியம்.

ஒரு மாடலை மட்டும் உருவாக்கி நிறுவனத்துக்கு அளிப்பது சரியான முறையல்ல. அது முழுமையான, சரியான, பக்காவான ஒரு தீர்வைத் தருமென்பதில்லை. எனவே பல மாடல்களை உருவாக்கி அதில் எது சிறந்ததாக இருக்கிறதோ, அதைப் பயன்படுத்துவதே சரியான வழி.

அல்காரிதங்கள், மெஷின் லேர்னிங் கான்செப்ட் போன்றவற்றையெல்லாம் பயன்படுத்தும் சரியான இடம் இது தான்.

எவ்வளவு தெளிவான, அழகான மாடலிஅ உருவாக்குகிறோம் என்பதல்ல முக்கியம். அந்த மாடல் நமக்குத் தேவையான ஒரு தீர்வைத் தருமா என்பதே கேள்வி. அதற்குத் தேவையான முயற்சிகளை எடுப்பதே இங்கே முக்கியமான விஷயம்.

5. அறிக்கை தயாரித்தல்

ரிப்போர்ட் ஜெனரேஷன் என்பது எந்த ஒரு பணியிலும் கிட்டத்தட்ட கடைசியில் வருகின்ற ஒரு வேலை. அது தான் அந்த ஒட்டு மொத்தப் பணிக்கும் ஒரு மரியாதையைக் கொண்டு வரும். ராப்பகலா கண்ணு முழிச்சு படிச்சேன், ஆனா பரீட்சைக்கு எதுவும் எழுதல என்றால் எப்படி இருக்கும். அதே போல தான், என்ன தான் முழு உழைப்பையும் போட்டு மாடல் உருவாக்கினாலும், அதை சரியான முறையில் காட்டவில்லையேல் பயனில்லை.

இந்த ஏரியாவை பலரும் அலட்சியமாக நினைப்பதுண்டு. ஆனால் இது மிக முக்கியமான ஒரு கட்டம் என்பதைப் புரிந்து கொள்ள வேண்டும்.

பார்த்தவுடன் பளிச் என புரிகின்ற படங்கள் மூலமாகவோ, புள்ளி விவரங்கள் மூலமாகவோ, இதை எளிமையாக விளக்குவது பயனளிக்கும். டைனமிக் ரிப்போர்ட்டிங் எனப்படும் தகவல்களை மாற்றுவதற்கு ஏற்ப மாறுகின்ற ஆன்லைன் ரிப்போர்டிங் இங்கே ரொம்ப வலிமையானது.

இவை தான் தகவல் அறிவியல் வேலையில் நடக்கின்ற பணிகள்.

( தொடர்வோம் )

தகவல் அறிவியல் – 4

Image result for data science

தகவல் அறிவியல் துறையில் வேலை வாய்ப்புகள் அதிகமாய் இருக்கிறது என்பதையும்,  கணிதம், பட்டப்படிப்பு, மென்பொருள் போன்றவற்றைப் படித்தவர்களுக்கு அங்கே வேலை வாய்ப்புகளும் அதிகமாய் இருக்கின்றன என்பதையும் கடந்த வாரம் அலசினோம். அப்படி இந்த துறையில் எப்படிப்பட்ட வேலைகள் இருக்கின்றன என்பதைப் பற்றிய ஒரு அறிமுகத்தைப் பார்போம்.

தகவல் அறிவியல் துறையில் பல்வேறு வேலைகள் இருக்கின்றன. நிறுவனத்தின் தேவைக்கும் தன்மைக்கும் ஏற்ப அவர்கள் அவற்றுக்கு பெயரிட்டு அழைப்பதும் உண்டு. உதாரணமாக சில நிறுவனங்கள் தகவல் விஞ்ஞானத்தை, மெஷின் லேர்னிங் என்றும் அழைப்பதுண்டு. பொதுவாக எப்படிப்பட்ட வேலைகள் இந்த துறையில் உண்டு என்பதை பார்ப்போம்.

மேஜேஜ்மென்ட் இன்ஃபர்மேஷன் சிஸ்டம்ஸ் ரிப்போர்டிங் எக்சிகியூட்டிவ் ( MIS Reporting Executive ) என ஒரு பணி இருக்கிறது. தகவல் அறிவியலைப் பொறுத்தவரை இது ஒரு மிக முக்கியமான பணி. வணிகத் தேவை என்ன என்பதை சரியாகப் புரிவதும், தொழில்நுட்பத்தில் அதை எப்படி புகுத்துவது என்பதையும் இவர்கள் தான் முடிவு செய்வார்கள். அதாவது இவர்கள் கொடுக்கின்ற அறிக்கைகளின் அடிப்படையில் தான் பெரும்பாலான பிசினஸ் முடிவுகள் எடுக்கப்படும்.

இவர்களுடைய பணி, நிறுவனத்துக்குத் தேவையான அறிக்கைகளை பல்வேறு வகைகளில் உருவாக்குவது. நூற்றுக்கணக்கான பக்கங்களில் எழுதி வைக்கவேண்டிய தகவல்களை ஒரு சின்ன படத்தின் மூலம் காட்டி விடும் வித்தை இவர்களின் சிந்தனைக்கு உரியது.

உதாரணமாக, விற்பனைத் தகவல்கள் என்னென்ன ? என்னென்ன பொருட்கள் கைவசம் இருக்கின்றன ? எப்படிப்பட்ட விமர்சனங்கள் வந்திருக்கின்றன ? போன்ற  பல்வேறு தகவல்களை இவர்கள் அலசுவார்கள். அதன் அடிப்படையில் அவர்கள் உருவாக்கும் அறிக்கைகள் முக்கியமான தொழில் முடிவுகள் எடுக்க வசதியாக இருக்கும்.

கணினி துறை அல்லது பொறியியலில் பட்டப்படிப்பு இருப்பவர்கள் இந்தத் துறையில் நுழைவது அவர்களுக்கு எளிதாக இருக்கும். “எப்படிப்பட்ட தகவல்களைக் கொடுத்தால் பிஸினஸ் வளரும்” என்கின்ற ஒரு பரந்து பட்ட பார்வை இருக்க வேண்டியது அவசியம். காரணம், இவர்கள் கொடுக்கின்ற தகவல்களே பிஸினஸை அடுத்த நிலைக்கு கொண்டு செல்லவும், எப்படிப்பட்ட திசையில் பயணிக்க வேண்டும் என்பதை முடிவு செய்யவும், எப்படிப்பட்ட மாற்றங்களைக் கொண்டு வரவேண்டும் என்பதைத் தீர்மானிக்கவும் உதவுகின்றன.

பிஸினஸ் அனலிஸ்ட் ; இன்னொரு முக்கியமான பணி. இதை வணிக ஆய்வாளர் பணி என்று சொல்லலாமா ? அல்லது தொழில் ஆய்வாளர் என்று சொல்லலாமா தெரியவில்லை. இப்போதைக்கு பிசினஸ் அனலிஸ்ட் என்றே வைத்துக் கொள்வோம்.

ஒரு நிறுவனத்தின் தேவையை துவக்கத்திலிருந்தே கவனிப்பது இவர்களுடைய வேலை. ஒரு பிஸினஸ் வளர்ச்சியடைய என்னென்ன தடைகள் இருக்கின்றன. என்னென்ன இடைவெளிகள் இருக்கின்றன என்பதைக் கண்டறிவது இவர்களுடைய வேலையின் முக்கியமான அம்சம்.

தகவல்களை அலசி ஆராய்பவர்களைத் தகவல் ஆய்வாளர் என்று சொல்வோம். அதே போல பிஸினஸை அலசி ஆராய்பவர்களே இந்த பிஸினஸ் அனலிஸ்ட் என அழைக்கப்படுகின்றனர்.

பிஸினஸ் அட்மினிஸ்ட்ரேஷன் (எம்.பி.ஏ) பிரிவில் ஒரு பட்டப்படிப்பு இருப்பது இந்த வேலைக்கு ரொம்ப நல்லது. கூடவே தகவல்களோடு விளையாடும் ஆர்வம் இருக்க வேண்டும். பிஸினஸை எப்படியெல்லாம் வலுப்படுத்தலாம் எனும் பார்வை இருக்க வேண்டியதும் அவசியம்.

பிஸினஸின் தேவையை சரிவரப் புரிந்து அதிலுள்ள குறைகளைக் களைந்து தொழில்நுட்பத்தின் மூலம் அதை வலுப்படுத்தும் பணியே இந்த பிஸினஸ் அனலிஸ்ட் பணி.

டேட்டா அனலிஸ்ட்

தகவல் அறிவியலில் மிக முக்கியமான பணிகளில் ஒன்று டேட்டா அனலிஸ்ட் வேலை. தகவல்களைத் திரட்டுவது, திரட்டிய தகவல்களை வகைப்படுத்துவது இரண்டும் இவர்களுடைய கைவேலைகள். இவர்களும் டேட்டா விஞ்ஞானிகள் அதாவது டேட்டா சயின்டிஸ்ட் இருவரும் வேறு வேறு.

டேட்டா அனலிஸ்ட் என்பவர் அவருக்கு ரொம்ப ஜூனியர் என்று வேண்டுமானால் வைத்துக் கொள்ளலாம். ஆனால் மிக முக்கியமான அடிப்படைப் பணிகள் செய்வது இவர்கள் தான்.

டேட்டா அனலிஸ்ட் என்பவர் ஒரு சில முக்கியமான மென்பொருட்களைப் பற்றித் தெரிந்திருக்க வேண்டும். குறிப்பாக ஆர், பைத்தான், எச்.டி.எம்.எல், எஸ்.க்யூ.எல், சி ++, ஜாவா போன்ற அனைத்து மென்பொருட்களின் கலவையாய் உங்களுடைய மென்பொருள் பரிச்சயம் இருப்பது மிக சிறப்பு.

தகவல்களை சேர்ப்பது, சேமிப்பது இவற்றோடு இவர்களுடைய பணி முடிந்து விடுவதில்லை. எப்படி அதை பயன்படுத்துவது என்பதையும் இவர்கள் யோசிக்க வேண்டும். ஹடூப் போன்ற மென்பொருட்களைக் கற்பது பயன்கொடுக்கும்.

நிறுவனத்தின் பல்வேறு நிலைகளிலுமுள்ள தலைவர்கள், வெவ்வேறு தகவல் தேவைகளோடு அணுகுவது இவர்களைத் தான். இவர்களும் அவர்களுடைய தேவைகளை நிறைவேற்றும் வகையில் தங்களுடைய மூளையையும், கையிலுள்ள தகவலையும் கசக்குவார்கள்.

எப்படி தகவலை வகைப்படுத்துவது, அதை எப்படி பயனுள்ள வகையில் மாற்றுவது, அல்காரிதங்களை/வழிமுறைகளை எழுதுவது, என்பதையெல்லாம் கவனிப்பது இவர்கள் தான்.

  1. ஸ்டாட்டிஸ்டிஷியன் / புள்ளிவிவர ஆய்வாளர்

ஸ்டாட்டிஸ்டிக் விஷயங்களைச் சொல்லும் இவரைப் புள்ளி விவரப் புலி என்று சொல்லலாமா ? தகவல்களைச் சேர்த்து, வகைப்படுத்தி, பயன்படுத்துவத்தோடு மட்டுமல்லாமல், அதன் அடிப்படையில் முடிவுகளையும் எடுப்பது இவர்களுடைய வேலை.

மார்க்கெட் ரிசர்ட், போக்குவரத்து, கல்வி, விளையாட்டு, என எல்லா இடங்களிலும் இவர்களுடைய தேவை உண்டு. இந்த வேலைக்குள் நுழையவேண்டுமென்றால் பட்டப்படிப்பு அவசியம். அதிலும் குறிப்பாக  ஸ்டாடிஸ்டிக்ஸ் அல்லது கணிதவியலில் பட்டம் இருந்தால் ரொம்ப நல்லது.

இவர்களும் ஆர் போன்ற ஏதோ ஒரு மென்பொருளின் மீது அதிக பரிச்சயம் கொண்டிருக்க வேண்டியது அவசியம். இவர்களுடைய பணிக்கென பல மென்பொருட்கள் உள்ளன MATLAB, SAS, Python, Stata, Pig, Hive, SQL, Perl போன்றவை புள்ளிவிவரவியலாளர் அல்லது ஸ்டாட்டிஸ்டிஷியன் பணிக்கு உதவுவதற்காக இருக்கின்ற மென்பொருட்கள். இவற்றில் சிலவற்றைக் கற்றுக்கொள்வது பயனளிக்கும்.

தகவல்களை அலசி அதில் ஒரு பேட்டர்ன் அதாவது முறையைக் கண்டுபிடிப்பது, தகவல்களுக்கு இடையே உள்ள தொடர்பைக் கண்டுபிடிப்பது, ஒரு டிரென்ட் கண்டுபிடிப்பது போன்றவற்றையெல்லாம் இவர்கள் கவனிப்பார்கள்.

5

டேட்டா சயின்டிஸ்ட்

இன்றைக்கு இருக்கக் கூடிய தகவல் அறிவியல் வேலைகளில் ஹாட் வேலை என்றால் இது தான். இதற்கு கொஞ்சம் அனுபவம் இருக்க வேண்டும். எல்லா நிறுவனங்களிலும் டேட்டா சயின்டிஸ்ட் வேலை தேவை இருக்கும். ஒவ்வொரு நிறுவனத்துக்கும் கொஞ்சம் கொஞ்சம் வித்தியாசமான திறமைகளில் டேட்டா சயின்டிஸ்ட் தேவைப்படுவார்கள்.

மென்பொருட்களின் மீதான பரிச்சயம் இதற்கு மிக மிக அவசியம்.  R, SAS, Python, SQL, MatLab, Hive, Pig, மற்றும் Spark போன்றவை இதற்குத் தேவையான மென்பொருட்கள் !

ஒரு நல்ல தகவல் விஞ்ஞானியின் வேலை தகவல்களோடு முடிந்து விடுவதில்லை. அந்த தகவல்களுக்கும் நிறுவனத்துக்கும் இடையேயான பிணைப்பைக் கண்டறியும். அந்த தொடர்பை வைத்துக் கொண்டு எப்படியெல்லாம் பிஸினஸை வளர்த்தலாம் என்பதை அலசும்.

இந்த பணிக்கு ஆர்வமும், பொறுமையும் மிக மிக அவசியம். நல்ல தெளிவான சிந்தனையும், திறமையும் இருந்தால் இந்தத் துறையில் கலக்கலாம்.

ஒரு டேட்டா சயின்டிஸ்ட் என்பவர் சுருக்கமாகச் சொல்லவேண்டுமெனில் ஒரு டேட்டா அனலிஸ்ச்ட், ஒரு பொறியாளர், ஒரு பிஸினஸ் அனலிஸ்ட் போன்ற பலவற்றின் கலவையாக இருப்பார்.

6

டேட்டா எஞ்சினியர்

பெரும்பாலும் பிக்டேட்டா சார்ந்த பணிகளைக் கவனிப்பதற்கு டேட்டா எஞ்சினியர்கள் தேவைப்படுவார்கள். இவர்களை டேட்டா ஆர்கிடெக்ட் என்றும் அழைப்பார்கள்.

தகவல் பொறியாளர்களுக்கு கணினி பிரிவில் ஒரு பட்டப்படிப்பு அவசியம். கூடவே Pig, Hadoop, MapReduce, Hive, MySQL, Cassandra, MongoDB, NoSQL போன்றவற்றில் பரிச்சயம் இருப்பது தேவையானது. அதே போல மென்பொருட்களான R, Python, Ruby, C++, Perl, Java, SAS, SPSS, and Matlab போன்றவற்றில் நல்ல பரிச்சயம் இருக்க வேண்டியதும் மிக மிக அவசியம்.

தகவல்களை வகைப்படுத்துவது, அதை டெஸ்ட் செய்வது, அதை நிறுவனத்தின் தேவைக்கு ஏற்ப அறிக்கையாய், படங்களாய் சமர்ப்பிப்பது இவையே இவர்களுடைய முக்கியமான வேலை.

இவை தவிர, பிக்டேட்டா பொறியாளர், மெஷின் லேர்னிங் பொறியாளர் என பலர் இந்த தகவல் அறிவியல் துறையின் பட்டியலில் வருவார்கள்.

மேலே குறிப்பிட்டுள்ளவை தகவல் அறிவியல் துறையிலுள்ள சில முக்கியமான வேலைகள். இவற்றைத் தவிரவும் பல வேலைகள் தகவல் அறிவியல் துறையில் உண்டு. இந்தப் பணிகளுக்குத் தேவையான திறமைகளை வளர்த்துக் கொண்டால் தகவல் அறிவியல் துறையில் நுழைவதில் சிக்கல் இருக்காது.

Data Science 3 : தகவல் அறிவியல் ‍ 3

Image result for data science

தகவல் அறிவியலின் பரபர வளர்ச்சி இன்றைக்கு இளைஞர்களை வெகுவாக‌ வசீகரித்திருக்கிறது. அதை நோக்கி பலர் தங்களுடைய பார்வையைத் திருப்பியிருக்கின்றனர். இதையே வாய்ப்பாக வைத்துக் கொண்டு பலர் ஃபாஸ்ட் புட் போல‌ பயிற்சி நிலையங்களை உருவாக்கி தகவல் அறிவியல் கற்றுத் தருகிறேன் என வலை விரிக்கத் துவங்கியிருக்கின்றனர். பயிற்சி நிலையம் சின்னதாக இருக்கிறதா ? பெரியதாக இருக்கிறதா என்பதல்ல பிரச்சினை. சரியான விதத்தில், சரியானவர்களால், சரியானவைகளைக் கற்றுத் தருகிறார்களா என்பதே முக்கியம்.

தகவல் அறிவியல் மீதான வசீகரம் இருப்பது நல்லது தான். நீச்சல் தெரியாமல் குளத்தில் குதிப்பதைப் போலவோ, நீச்சலே பிடிக்காமல் குளத்தில் குதிப்பதைப் போலவோ டேட்டா சயின்ஸ் துறையில் நுழைவது காலவிரயம் ! யாரெல்லாம் தகவல் அறிவியலைக் கற்றுக் கொள்ளலாம் ?. அல்லது டேட்டா சயின்ஸைக் கற்றுக் கொள்ள  என்னென்ன திறமைகள் இருக்க வேண்டும் ? என்பதைப் பற்றிய ஒரு அடிப்படைப் புரிதல் நமக்கு இருக்க வேண்டும்.

இன்றைக்கு தகவல் அறிவியலைக் குறித்து பேசும் பலரும் பல விதமான தகவல்களைத் தருகின்றனர். இதில் எது சரி, எது தவறு என்பதைப் புரிந்து கொள்வதில் பலருக்கும் குழப்பம். ஹடூப், மெஷின் லேர்னிங், அனாலிடிக்ஸ், சயின்டிஸ்ட் போன்ற வார்த்தைகள் தகவல் அறிவியல் துறையில் நுழைய விரும்பும் இளைஞர்களை குழப்பக் கூடும். எனவே தகவல் அறிவியல் குறித்து இதுவரை மற்றவர்கள் சொன்ன விஷயங்களை கொஞ்ச நேரம் ஒதுக்கி வையுங்கள். தகவல் அறிவியலுக்குள் நுழைய அடிப்படையாக என்னென்ன தேவை என்பதை மிக மிகச் சுருக்கமாகப் பார்த்து விடுவோம்.

முதலாவது, தகவல் அறிவியல் என்பது எண்களோடு விளையாடும் வேலை. புள்ளி விவரங்கள், கூட்டல், கழித்தல், அல்காரிதம், கேல்குலஸ், நிகழ்தகவு போன்ற விஷயங்கள் தகவல் அறிவியலின் முதுகெலும்பாக இயங்கக் கூடியவை. இவை எல்லாமே கணிதவியலின் அடிப்படை விஷயங்கள். எனவே, தகவல் அறிவியல் கற்றுக் கொள்ள விரும்புபவர்களுக்கு முதலில் இருக்க வேண்டிய தகுதி, கணிதவியலில் அறிவு.

அதற்காக கணிதவியலில் இளங்கலைப் பட்டமோ, முதுகலைப் பட்டமோ இருந்தால் தான் தகவல் அறிவியலில் நுழைய முடியும் என்றில்லை. கணிதத்தின் மீது ஆர்வமும், அடிப்படை அறிவும், கற்றுக் கொள்ளும் விருப்பமும் இருந்தால் போதும். கணிதம் என்றாலே காத தூரம் ஓடுபவர்கள் தகவல் அறிவியல் பக்கம் வராமல் இருப்பது நல்லது அப்படிப்பட்டவர்களுக்கு தேவையற்ற மன அழுத்தங்களை தகவல் அறிவியல் தரலாம்

தகவல் அறிவியல் துறைக்கு பல்வேறு நிலையிலுள்ள மக்களும் வருகின்றனர். இப்போது தான் படித்து முடித்த மாணவர்கள் முதல் பி.ஹைச்.டி முடித்த அறிவர்கள் வரை இதில் அடக்கம். அதனால் சிலர், “பி.ஹைச்.டி படித்தால் தான் இதெல்லாம் புரியும் போல !”, என தவறாய் நினைப்பதுண்டு. அந்த நினைப்புகளையெல்லாம் முளையிலேயே கிள்ளி எறியுங்கள்.

இரண்டாவது தேவை, கணினி அறிவு. மென்பொருள் எழுதத் தெரிந்திருக்க வேண்டும் என்பது அடிப்படைத் தேவை. அட்வான்ஸ் மென்பொருட்கள் தெரிந்திருக்க வேண்டியதில்லை. அவற்றைப் படிப்படியாகக் கற்றுக் கொள்ளலாம். ஆனால் அடிப்படை மென்பொருள் அறிவு கண்டிப்பாகத் தேவை. தகவல்களை அல்காரிதங்களின் மூலமாய் தேவையான தகவல்களாக மாற்றுவதற்கு மென்பொருள் அறிவு அவசியம்.

பைத்தான். ஆர் போன்ற மென்பொருட்கள் தெரிந்திருந்தால் மிக எளிது. இல்லாவிட்டாலும் பிரச்சினையில்லை. அடிப்படை மென்பொருட்களான சி, சி++, ஜாவா போன்ற மென்பொருட்களில் நல்ல பரிச்சயம் இருந்தாலே போதும். மென்பொருள் பற்றிய பரிச்சயம் அறவே இல்லை என்பவர்களால் தகவல் அறிவியல் துறையில் நுழைய முடியாது. எனவே கொஞ்சம் புரோகிராமிங் பக்கம் பார்வையை செலுத்துவது அவசியம்.

அதிலும், டேட்டா பேஸ் எனப்படும் தகவல் சேமிப்பு மென்பொருட்கள் பற்றிய அறிவு நிச்சயம் இருக்கவேண்டும். எப்படியெல்லாம் தகவல்களை சேமிக்கலாம், அதை எந்தெந்த வகையில் எடுக்கலாம், எப்படியெல்லாம் வகைப்படுத்தலாம், என்னென்ன கேள்விகள் மூலம் தகவல்களைப் பிரித்தெடுக்கலாம் என்பதையெல்லாம் கற்றுக் கொள்ள எஸ்.க்யூ.எல் அடிப்படை அறிவு இருப்பது தேவையானது ! இங்கும் கவனிக்க வேண்டிய விஷயம், இதிலெல்லாம் சூப்பர் டூப்பர் ஆட்களாய் இருக்க வேண்டிய அவசியம் இல்லை என்பது தான். ஆனால் நன்றாகத் தெரிந்திருக்க வேண்டும் என்பது கட்டாயம்.

டொமைன் ஸ்கில்ஸ் எனப்படும் கள அறிவு தகவல் அறிவியல் துறையில் முக்கியமானது. ஆனால் இதை துவக்கத்திலேயே படித்து விட முடியாது. நாம் எந்த துறையில் தகவல் அறிவியல் பணி செய்யப் போகிறோமோ அந்தத் துறை சார்ந்த விஷயங்களைக் கற்றுக் கொள்வது தான் சரியானது. உதாரணமாக மருத்துவத் துறையில் தான் தகவல் அறிவியல் வேலை செய்யப் போகிறீர்கள் என்றால், “ஹெல்த்கேர்’ டொமைன் பற்றி நன்றாகத் தெரிந்து வைத்திருப்பது அவசியம்.

தகவல் அறிவியல் கொண்டு வருகின்ற முடிவுகளை அலசவும், எப்படிப்பட்ட முடிவுகள் பயன்படும் என்பதை முடிவு செய்யவும் டொமைன் ஸ்கில்ஸ் தேவை. மருந்துகளின் தேவைகள் பற்றிய புள்ளிவிவரத்தை அதைப்பற்றி எதுவுமே தெரியாதவர்கள் படித்தால் புரியாது இல்லையா ? அது தான் அடிப்படை விஷயம்.

வங்கித் துறை சார்ந்த தகவல் அறிவியல் எனில் பேங்கிங் டொமைன் கற்றுக் கொள்ள வேண்டும். காப்பீடு துறை சார்ந்த டேட்டா சயின்ஸ் பணியெனில் ‘இன்சூரன்ஸ் டொமைன்’ கற்றுக் கொள்ள வேண்டும். வணிகம் சார்ந்த ஏரியா எனில் ‘ரிடெயில் டொமைன்’ தெரிந்திருக்க வேண்டும். இப்படி தேவையான ஒன்றைத் தெரிந்து கொள்ளலாம். டொமைன் ஸ்கில்ஸ் எனப்படுவதை ஒரே நாளிலோ, ஒரு படிப்பின் மூலமாகவோ கற்றுக் கொள்ள முடியாது. அடிப்படை அறிவைப் பெற்றுக் கொண்டு பின்னர் படிப்படியாக அதை வளப்படுத்திக் கொள்ளலாம்.

தகவலை விஷுவலைஸ் செய்து பார்ப்பது, அதாவது கற்பனை செய்து பார்ப்பது என்பது இந்த படிப்புக்கு தேவையானது. ஒரு துப்பறிவாளன் கையில் கிடைக்கும் ஒரு சின்ன பொருள் ஒரு பெரிய குற்றத்தைத் துப்பு துலக்க உதவுவது போல, தகவல் அறிவியலாளனின் கையில் கிடைக்கின்ற தகவல்கள் மிகப்பெரிய மாற்றத்துக்குரிய விடையைத் தர முடியும். அதற்கு, ‘இந்த தகவலை வைத்து என்ன செய்யலாம்’ என கற்பனை செய்து பார்க்கும் விஷுவலைசிங் திறமை அவசியம்.

அடிப்படையாக ஒரு பட்டப்படிப்பு இருப்பது ரொம்ப நல்லது. கணிதம், அறிவியல், காமர்ஸ் போன்ற பட்டப்படிப்பு இருந்தால் சிறப்பு !  பட்டப்படிப்பு இந்தத் துறையில் உங்களை முழுமையாக ஈடுபடுத்திக் கொள்ளும் ஊக்கத்தைத் தரும். ஒருவேளை வேறு நிறுவனங்களில், துறைகளில் வேலைபார்த்த அனுபவம் உடையவர்கள் பட்டப்படிப்பு இல்லாமலும் இந்த துறையில் நுழையலாம்.

கம்யூனிகேஷன் ஸ்கில்ஸ் எனப்படும் உரையாடல் திறனும் இந்த துறைக்கு ரொம்பவே கை கொடுக்கும். தகவல்கள் எப்போதும் நமக்கு எளிதில் கிடைத்து விடுவதில்லை. அதற்கு நமது உரையாடல்கள் தேவைப்படும். அதே போல, நாம் உருவாக்குகின்ற பணிகளை மிகத் திறமையாக அடுத்தவர்களுக்கு எடுத்துரைக்கவும் கம்யூனிகேஷன் திறமை மிக அவசியம்.

எல்லாவற்றுக்கும் மேலாக இருக்க வேண்டிய இரண்டு முக்கியமான விஷயங்கள் உற்சாகமும், புதுமையை விரும்பும் மனமும். தகவல்களை எப்படியெல்லாம் பயன்படுத்தலாம், எப்படியெல்லாம் அலசலாம், எப்படிப்பட்ட வகைகளில் வகைப்படுத்தலாம் என்பதெல்லாம் புதுமையை விரும்புபவர்களால் மட்டுமே முடிவு செய்ய முடியும். நூல் கண்டு போல சுற்றிப் பிணைந்து கிடக்கின்ற தகவல்களை சிக்கலில்லாமல் பிரித்தெடுக்க, தேவையற்ற தகவல்களை வெட்டி எறிய உற்சாக மனம் ரொம்ப முக்கியம். அடிப்படையாக, பிசினஸை எப்படியெல்லாம் வளப்படுத்தலாம், வலுப்படுத்தலாம் எனும் சிந்தனை ஓடிக்கொண்டே இருக்க வேண்டும். இவையெல்லாம் தான் ஒருவரை தகவல் அறிவியலில் சிறப்புற வைக்கும்.

சுருக்கமாக கணிதத்தில் பரிச்சயமும் ஆர்வமும் இருக்கிறதா ? ஓரளவு மென்பொருள் பரிச்சயம் இருக்கிறதா ? புதுமை செய்யும் ஆர்வம் இருக்கிறதா ? தகவல்களோடு விளையாடும் பொறுமை இருக்கிறதா ? எனில் நீங்கள் தைரியமாக இதில் காலெடுத்து வைக்கலாம்.

( தொடர்வோம் )

Data Science 2 :தகவல் அறிவியல் 2

“வேலை காலியாக இருக்கிறது ! ஐம்பது இலட்சம் பேர் அவசரமாக தேவை”

இன்றைய சூழலில் இப்படி ஒரு விளம்பரம் வந்தால் ஆச்சரியப்படாமல் இருக்க முடியுமா ? உண்மையில் அப்படி ஒரு எண்ணிக்கையிலான அளவுக்கு ‘தகவல் அறிவியல்’ எனப்படும் டேட்டா சயின்ஸ் துறையில் ஆட்கள் தேவைப்படுவார்கள் என்பது தான் யதார்த்தம். அவ்வளவு ஆட்கள் ஏன் தேவை ? தகவல்களை வெச்சு அவ்ளோ விஷயம் நடக்குதா என்ன ? என மனதில் முட்டி மோதும் கேள்விகளுக்குப் பதிலளிக்க வேண்டுமானால் முதலில், டேட்டா சயின்ஸினால் விளைகின்ற நன்மைகள் என்னென்ன என்பதைப் புரிந்து கொள்ள வேண்டும்.

தகவல் அறிவியலின் பயன்பாடு இல்லாத இடம் என்று ஒன்று இனிமேல் இருக்கப் போவதில்லை எனுமளவுக்கு தகவல் அறிவியல் எல்லா இடங்களிலும் நீக்கமற நிறைந்திருக்கப் போகிறது.

உதாரணமாக ஒரு பெரிய சூப்பர் மார்க்கெட்டுக்குப் போகிறீர்கள் என வைத்துக் கொள்ளுங்கள். அங்கே நுழைந்தவுடன் உங்கள் கண்ணுக்குத் தெரியும் விதமாக சில பொருட்கள் இருக்கும். அதாவது கண்பார்வைக்கு நேரான உயரத்தில் !  சில பொருட்கள் கீழே இருக்கும், எளிதில் தட்டுப்படாது. இன்னும் சில பொருட்கள் உயரமான இடத்தில் இருக்கும் பெரியவர்களுக்கு மட்டுமே பார்க்க முடியும். இன்னும் சில பொருட்கள் ‘பில்’ போடும் இடத்துக்கு பக்கத்திலேயே இருக்கும் !  ஏன் இப்படியெல்லாம் அடுக்கி வைக்கிறார்கள் ? என எப்போதாவது யோசித்துப் பார்த்ததுண்டா ?

இவற்றையெல்லாம்  முடிவு செய்வது ‘டேட்டா சயின்ஸ்’ தான் ! ஒரு கடையில் எந்தெந்த பொருட்கள் அதிகமாக விற்பனையாகின்றன ? எந்தெந்த பொருட்கள் குறைவாக விற்பனையாகின்றன ? எந்த பொருட்கள் தவிர்க்க முடியாதவை ? எந்த பொருட்கள் பில் போடும் நேரத்தில் கண்களைக் கவரும் ? என அனைத்து விஷயங்களையும் அலசி ஆராய்ந்து தான் இந்த  அடுக்கி வைக்கும் முறையையே முடிவு செய்கின்றனர். இது வர்த்தகத்தைப் பெருமளவில் அதிகரிக்க உதவுகிறது.

அமெரிக்காவின் பிரபலமான வால்மார்ட் கடைகள் பற்றி உங்களுக்குத் தெரிந்திருக்கும். கடையே அரை கிலோமீட்டர் அளவுக்கு விரிந்து பரந்ததாய் இருக்கக் கூடிய கடைகள் அவை. அவர்கள் டேட்டா சயின்ஸை உதவிக்கு அழைத்து எந்தெந்த பொருட்கள் விற்பனையாகின்றன, எந்தெந்த பொருட்கள் விற்பனை குறைவாக இருக்கின்றன ? போன்ற தகவல்களைத் திரட்டினார்கள். அந்த ஆய்வின் அடிப்படையில் தான் பொருட்களை எங்கே வைக்கவேண்டும், எப்படி வைக்க வேண்டும், எவ்வளவு வைக்க வேண்டும் என்பதைண்டும்யெல்லாம் முடிவு செய்தனர். அதன் பின் அவர்களுடைய வர்த்தகம் வளர்ந்தது !

அதில் ஒரு சுவாரஸ்யமான விஷயத்தைம்யும் கண்டு பிடித்தனர். வெள்ளிக்கிழமைகளில் குழந்தைகளுக்கான டயாப்பர் அதிகமாக விற்பனையானது ! அதென்னடா விஷயம் வெள்ளிக்கிழமை என்பது புரியாத புதிராய் இருந்தது. அதே நாளில் பீர் விற்பனையும் அதிகமாய் இருந்தது ! இரண்டுக்கும் இடையே உள்ள தொடர்பை ஆராய்ந்து பார்த்தால், டயாப்பர் வாங்கும் நபர்களே பீரையும் வாங்குவது தெரிந்தது !  அது எல்லாமே ஆண்கள் தான் என்பதையும் அவர்களுடைய அலசல் காட்டிக் கொடுத்தது. அதன்பின் வால்மார்ட் நிர்வாகம் டயாப்பர் இருக்கும் இடத்துக்கு பக்கத்திலேயே பீர் வகைகளையும் அடுக்கி வைத்தது. இந்த இரண்டு விஷயங்களும் எளிதில் கண்ணுக்குத் தட்டுப்படும் வகையிலும் வைக்கப்பட்டது ! அதன் பின் விற்பனை இன்னும் அதிகரித்தது !

டயாப்பருக்கும், பீருக்கும் என்ன சம்பந்தம் இருக்க முடியும் ? தகவல் அறிவியல் எனும் ஒரு நுட்பம்  இப்படி அலசி ஆராய்ந்து சொன்னால் மட்டுமே இப்படி ஒரு தொடர்பு இருப்பதை அறிய முடியும். இல்லையேல் ஏதோ மொட்டைக்கும் முழங்காலுக்கும் முடிச்சு போடுவது போல சம்பந்தம் இல்லாத விஷயமாகவே தோன்றும்.

அதே போல அமேசான்.காம் உட்பட எந்த ஒரு வர்த்தகத் தளத்துக்குப் போனாலும் ஒரு பொருளை தேடுவீர்கள். உடனே கீழே, அதே போன்ற பல பொருட்களின் தகவல்கள் வரும். இரண்டு பொருட்களைச் சேர்த்து வாங்கினால் தள்ளுபடி விலையில் கிடைக்கும் என வரும். இன்னும் ஒரு படி மேலே போய், நீங்கள் எந்த விலையில் பொருட்களைத் தேடுகிறீகளோ அந்த விலையை ஒட்டிய பொருட்கள் மட்டுமே கண்சிமிட்டும்.  இதன் பின்னணியில் இயங்குவதெல்லாம் டேட்டா சயின்சின் ஏதோ ஒரு அம்சம் தான்.

அப்படியே விளையாட்டுப் பக்கம் போவோம் ! கிரிக்கெட் பார்த்துக் கொண்டிருக்கிறீர்கள் என வைத்துக் கொள்ளுங்கள்.  ரோஹித் ஷர்மா 50 ரன்கள் அடித்தால் உடனே கணினியில் ஏகப்பட்ட புள்ளி விவரங்கள் வரும். ரோஹித் எத்தனை முறை அரை சதம் அடித்திருக்கிறார், யாருக்கு எதிராய் அடித்திருக்கிறார், யாருடைய பார்ட்னர் ஷிப்பில் அடித்திருக்கிறார், எந்தெந்த கிரவுண்டில் அடித்திருக்கிறார், எந்த இன்னிங்சில் அடித்திருக்கிறார், எந்த ஆண்டு அடித்திருக்கிறார், இதே போல யாரெல்லாம் அடித்திருக்கிறார்கள், என நாம் நினைத்துப் பார்க்க முடியாத அளவுக்கு புள்ளி விவரங்களை திணறத் திணற அள்ளித் தெளிப்பார்கள்.

இந்த புள்ளி விவரங்களை வைத்துக் கொண்டு எந்தெந்த களத்தில் எப்படிப்பட்ட ஸ்கோர் அடிக்கப்படலாம், களத்தின் தன்மையைப் பொறுத்து யாரெல்லாம் நன்றாக விளையாடலாம் களத்தின், எந்த பந்து வீச்சாளருக்கு எதிராக ரன்கள் எடுக்கப்படலாம் போன்ற பல விஷயங்களைக் கணிப்பார்கள். விளையாட்டுத் துறையில் நிறைய கணிப்புகளுக்கும், முடிவுகள் எடுப்பதற்கும் இத்தகைய தகவல்களே முதுகெலும்பாய் இருக்கின்றன. இந்த தகவல்களையெல்லாம் அள்ளி அள்ளித் தருவது சாட்சாத் டேட்டா சயின்ஸ் தான்.

விளையாட்டை விட்டு விட்டு மருத்துவப் பகுதியை எட்டிப் பார்த்தால், ஒரு மனிதனுடைய உடல்  ஒரு நாளில் தருகின்ற தகவல்களின் அளவு சுமார் 2 டெரா பைட் என்கிறது தகவல் தொழில்நுட்பம். மனிதனுடைய இதயத் துடிப்பு, இரத்த அழுத்தம், மூச்சு, தூக்கம், நடை என எல்லா விஷயங்களையும் கவனித்து தேவையான ஆலோசனைகளையும், வழிகாட்டுதல்களையும் தரக்கூடிய பல கருவிகளையும், மென்பொருட்களையும் பிரபல நிறுவனங்கள் உருவாக்கியிருக்கின்றன. இப்படி மருத்துவத் துறையில் நோய்களைக் கணிக்கவும், அதன் மூலம் நோய்களின் தாக்கத்தைக் குறைக்கவும், மருத்துவ ஆராய்ச்சிகளை வலுப்படுத்தவும் தகவல் அறிவியல் பயன்படுகிறது.

அதே போல பழைய நுட்பங்களில் இருந்த தவறுகளைத் திருத்திக் கொண்டு,  நோயாளிகளின் நோய்களை கனகட்சிதமாகக் கணிக்க டேட்டா சயின்ஸ் தான் பயன்படுகிறது. தனி நபருடைய மெடிகல் ஹிஸ்டரி, வாழ்க்கைச் சூழல் போன்றவற்றையெல்லாம் அலசி ஆராய முடிவதால் நபருக்கு ஏற்ற மருத்துவம் எனும் தளத்துக்கு மருத்துவ வளர்ச்சி இடம் மாறுகிறது. இனி வரும் காலங்களில் ‘காய்ச்சலுக்கு’ மருந்து எனும் நோய் சார் நிலையிலிருந்து ‘விஜயகுமார்’ க்கு மருந்து எனும் நபர் சார் மருத்துவத்துக்கு மருத்துவத் துறை இடம்பெயரும். அதற்கு டேட்டா சயின்ஸ் தான் துணை செய்யும்.

அப்படியே திரும்பி காப்பீட்டுத் துறைக்குத் தாவினால் அங்கும் டேட்டா சயின்ஸ் கோலோச்சத் துவங்கியிருக்கிறது. கார் இன்சூரன்ஸ் பக்கம் இப்போது பரவி வரும் ‘பே ஹவ் யு டிரைவ்’  எனும் கான்செப்ட் தகவல் அறிவியலின் சிந்தனையில் உருவானதே. அதாவது ஒருவர் கார் ஓட்டுகின்ற ஸ்டைல் எப்படி இருக்கிறது என்பதற்கு ஏற்ப காப்பீடு நிர்ணயிக்கப்படும். அவருடைய காரோட்டும் குணாதிசயத்தை தகவல் அறிவியல் கணித்துச் சொல்கிறது.

ஆளில்லாத கூகிள் கார் கூட டேட்டா சயின்சின் பிள்ளை தான். காரில் இருக்கின்ற பல்வேறு சிக்னல்கள் அள்ளித் தரும் தகவல்களின் அடிப்படையில் கார் பயணிக்கும். இதனால் விபத்துகள் குறையும். ஹெல்த் இன்சூரன்ஸ் பக்கம் போனால் ஒரு மனிதனுடைய உடல் நிலை, அவருடைய உணவுப் பழக்கம், அவருடைய குடிப்பழக்கம், அவருடைய உடற்பயிற்சி, தூக்கம் போன்ற பல்வேறு தகவல்களின் அடிப்படையில் இந்தக்  காப்பீட்டின் மதிப்பு நிர்ணயம் செய்யப்படும்.

வங்கித் துறையை எடுத்துக் கொண்டால் வாடிக்கையாளர்களுடைய தகவல்கள், அவர்களுடைய வங்கிக் கணக்குகள், அவர்கள் பணத்தைச் செலவு செய்யும் முறை என ஏகப்பட்ட விஷயங்களை டேட்டா சயின்ஸ் கணக்கில் கொண்டு வங்கிகளின் தரத்தை உயர்த்துகிறது. வங்கிகளில் நடக்கின்ற மோசடிகளைக் கண்டு பிடிக்கவும், வாடிக்கையாளர்களை வசீகரிக்கும் திட்டங்களை உருவாக்கவும் டேட்டா சயின்ஸ் கை கொடுக்கிறது.

இப்படி எந்த ஒரு துறையை எடுத்தாலும் தகவல் அறிவியல் தான் அதன் மையமாக நின்று செயல்படுகிறது. இதன் பல்வேறு அம்சங்கள் தான் மெஷின் லேர்னிங், பிக் டேட்டா, டேட்டா மைனிங் என பல பெயர்களில் உலா வருகிறது. இது தான் டேட்டா சயின்ஸ் துறை அதன் ஸ்பெஷலிஸ்ட்களை வலை வீசித் தேடிக்கொண்டிருக்கக் காரணம்.

இந்தத் துறைக்கு நுழைய என்னென்ன தெரிந்திருக்க வேண்டும் ?

( தொடர்வோம் )

Data Science 1 :தகவல் அறிவியல் 1

Image result for data science

பாய்ஸ் திரைப்படத்தில் ஒரு காட்சி வரும். நகைச்சுவைக்காக வைக்கப்பட்ட அந்தக் காட்சியில் தகவல் அறிவியலின் தேவையை மிக எளிமையாக விளக்கியிருப்பார் சுஜாதா.

செந்தில் ஒரு கோயில் மண்டபத்தில் உட்கார்ந்திருப்பார். அவரது கையில் ஒரு குட்டி புக் இருக்கும். அதில் நாள், கிழமை வாரியாக எந்தக் கோயிலில் எப்போது என்ன சாப்பாடு போடுவார்கள் எனும் குறிப்புகள் எழுதப்பட்டிருக்கும். அதை வைத்துக் கொண்டு ஹாயாக சாப்பிட்டு காலத்தை ஓட்டுவார் அவர். அவரிடம் வந்து கேட்பவர்களுக்கும் புக்கைப் புரட்டிப் பார்த்து, “இந்த கோயிலுக்கு இத்தனை மணிக்கு போ.. ஓட்டை போட்ட வடை தருவாங்க” என அனுப்பியும் வைப்பார். அந்த தகவல்களை வைத்துக் கொண்டு “இன்ஃபர்மேஷன் ஈஸ் வெல்த்” என அவர் சொல்லும் டயலாக் பிரபலமானது !

தகவல்களை சேமித்து வைத்து, அதைப் பயன்படுத்த வேண்டிய வகையில் பயன்படுத்துவது ரொம்பவே பயனளிக்கும் என்பதை சுஜாதா இந்த குட்டி காட்சியின் மூலம் இயல்பாக விளக்கியிருப்பார்.

இந்த சின்ன சிந்தனையை, பரந்து பட்ட தொழில்நுட்ப வெளியில் ஆழமாகவும், நீளமாகவும், பெரிய அளவிலும் அலசி ஆராய்ந்தால் அதை தகவல் அறிவியல் என்று சொல்லலாம்.

உதாரணம் ஒன்று சொல்கிறேன். ஒரு நிறுவனம் இருக்கிறது. அதன் மேலதிகாரி தன்னுடைய அக்கவுன்டிங் துறையைக் கூப்பிட்டு, “நம்ம கம்பெனில போன வருஷம் நடந்த செலவுகளோட ஒட்டு மொத்த டேட்டாவையும் கொண்டு வாங்க” என சொல்கிறார் என வைத்துக் கொள்வோம். ஊழியர்கள் உடனே போய் ஜனவரி மாதம் முதல் டிசம்பர் மாதம் வரை நடந்த செலவுகளின் பட்டியலை எடுப்பார்கள். சின்னச் சின்ன செலவு முதல், பெரிய பெரிய இன்வெஸ்ட்மென்ட் செலவுகள் வரை அனைத்தையும் கொண்டு வந்து மேலதிகாரியிடம் கொடுப்பார்கள். இது தான் டேட்டா ! தகவல் !

இந்தத் தகவலை அப்படியே வைத்திருப்பதில் எந்த பயனும் இல்லை. செயல்படாத தகவல் செத்த தகவல் என சொல்லலாம். அது வெறுமனே இடத்தை அடைத்துக் கொண்டு கிடக்கும் அவ்வளவு தான். ஆனால் மேலதிகாரி அத்துடன் நின்று விடுவதில்லை. மீண்டும் அவர்களைக் கூப்பிட்டு,

“என்னப்பா இப்படி கொண்டு வந்தா நான் என்ன பண்றது ? ஒவ்வொரு மாசம் எவ்வளவு செலவாச்சு ? என்ன டிப்பார்ட்மென்ட்க்கு எவ்ளோ செலவாச்சு ? சம்பளம் எவ்ளோ குடுத்திருக்கோம் ? முதலீடு எவ்ளோ செஞ்சிருக்கோம் ? இப்படி பிரிச்சு குடுப்பா” என்பார்.

ஊழியர்கள் போய் அந்த தகவல்களையெல்லாம் திருப்பிப் போட்டு, அலசி அதை முறைப்படுத்தி மேலதிகாரி கேட்ட வடிவத்தில் கொண்டு வந்து கொடுப்பார்கள். இது தான் கட்டமைக்கப்பட்ட அல்லது வகைப்படுத்தப்பட்ட தகவல். ஸ்ட்ரக்சர்ட் டேட்டா !

இப்போது அந்தத் தகவல்களைப் புரட்டிப் பார்க்கும் மேலதிகாரி ஊழியர்களை அழைத்து,

“யப்பா… மார்ச் மாசம் ஏகப்பட்ட செலவாகியிருக்கு ! சேல்ஸ் டீம்ல செலவு அக்டோபர் மாசம் எகிறியிருக்கு ! மாசா மாசம் பெட்ரோல் செலவு ராக்கெட் மாதிரி ஏறியிருக்கு..” என்னன்னு கொஞ்சம் பாத்து சொல்லு” என்பார்.

அப்போது ஊழியர்கள் அந்த தகவலை மேலும் அலசி ஆராய்ந்து அதற்குரிய பதிலோடு வருவார்கள். அக்டோபர் மாதம் போனஸ் என்றோ, மார்ச் மாதம் அட்வான்ஸ் பேய்மென்ட் என்றோ தங்கள் கண்டுபிடிப்பைச் சொல்வார்கள். இது தகவல் அலசல் ! டேட்டா அனாலிசிஸ் !

இப்போது மேலதிகாரி தன்னுடைய திட்டமிடல் குழுவை கூப்பிடுவார். கூப்பிட்டு தன்னிடம் இருக்கின்ற இந்த தகவல்களை எல்லாம் கொடுப்பார். “இதோ பாருங்க, இதான் கடந்த வருஷத்தோட செலவு. இதுல எல்லா விவரங்களும் இருக்கு. அடுத்த வருஷம் இந்த செலவில 10 சதவீதம் கம்மி ஆகணும். எல்லா மாசமும் செலவு கிட்டத்தட்ட ஒரே மாதிரி இருக்கணும், அதுக்கு என்ன பண்ணணுமோ அதை கண்டுபிடிச்சு சொல்லுங்க” என்பார். இப்போது திட்டக் குழுவினர், கடந்த ஆண்டின் தகவலை வைத்துக் கொண்டு எதிர்காலத்தை திட்டமிடுவார்கள். எதிர்காலத்தில் என்னென்ன செய்தால் மேலதிகாரி சொன்னதை நிறைவேற்றலாம் என்பதை முடிவுசெய்வார்கள். இது தான் டேட்டா அனாலிடிக்ஸ். பொதுவாகச் சொல்ல வேண்டுமெனில் டேட்டா சயின்ஸ். தகவல் அறிவியல்.

துவக்கத்தில் ஏனோதானோவென கிடந்த தகவல்கள், ஒன்று சேர்க்கப்பட்டு, வகைப்படுத்தப்பட்டு, தரம்பிரிக்கப்பட்டு, பயன்படுத்தக்கூடிய வகையில் மாற்றப்பட்டு, எதிர்காலத்துக்கான முடிவுகளை நிர்ணயிக்கும் காரணியாக உருமாற்றம் அடைகிறது. இது தான் தகவல் அறிவியல் என்பதன் ஆகச் சுருக்கமான விளக்கம்.

இந்த தகவல்களெல்லாம் நாம் நினைப்பது போல அழகாக கணினியில் டைப் செய்து சேமிக்கப்பட்டிருப்பவை மட்டுமல்ல. பல்வேறு விதமான தகவல்கள், பல்வேறு விதமான வடிவங்களில் கிடைக்கின்றன. கணினியிலோ, காகிதத்திலோ நாம் தெளிவாக எழுதி வைத்திருக்கும் தகவல்கள் முறைப்படுத்தப்பட்ட தகவல்கள். அல்லது ஸ்ட்ரக்சர்ட் டேட்டா. இதைக் கையாள்வது எளிது. இந்த தகவல்களை அலசி ஆராய்வதும், அதன் மூலமாக புதிய முடிவுகளை எடுப்பதும் மிக எளிது.

ஆனால் முறைப்படுத்தப்படாத தகவல்கள் விஷயத்தில் அது கடினம். அதென்ன முறைப்படுத்தப்படாத தகவல் ? அலுவலகத்தில் ஆங்காங்கே கண்காணிப்பு கேமராக்கள் இருக்கும். அந்த கேமராக்கள் 24 மணி நேரமும் கண்சிமிட்டி காட்சிகளைப் பதிவு செய்து கொண்டே இருக்கும். கார் பார்க்கிங்கிலும், அலுவலகத்தைச் சுற்றியும் இதே போல பல கேமராக்கள் சுற்றிச் சுற்றி காட்சிகளை தனக்குள் அடுக்கிக் கொண்டே இருக்கும் ! இந்த வீடியோ காட்சிகள் முறைப்படுத்தப்படாத தகவலின் ஒரு உதாரணம் !

அலுவலகத்தில் தலைமை அதிகாரி ஒருமணி நேர உற்சாக உரையாற்றுகிறார் என வைத்துக் கொள்வோம். அதில் பல விஷயங்கள் இருக்கும். பல திட்டங்களின் துவக்க நாட்கள் இருக்கும். அந்த உரை ஒரு கட்டமைக்கப்படாத தகவல். அதிலிருந்து தேவையான தகவல்களை பிரித்தெடுக்க வேண்டும்.

ஒரு அலுவலகத்தை எடுத்துக் கொண்டால் இத்தகைய தகவல்கள் எக்கச்சக்கமாக குவிந்து கிடக்கும். நீண்டு கொண்டே இருக்கின்ற அனுமர் வால் போல அவை பயம் காட்டும். நெருங்கிச் செல்லச் செல்ல விலகி ஓடும் தொடுவானம் போல களைப்பை ஏற்படுத்தும்.

அன்னியன் திரைப்படத்தில் வருகின்ற காட்சி நினைவுக்கு வருகிறதா ? ஐந்து பைசா திருடுவது தவறில்லை. ஆனால் ஐந்து இலட்சம் பேர், ஐந்து ஐந்து பைசாவாக‌, ஐந்து இலட்சம் தடவை திருடினால் அது மிகப்பெரிய திருட்டாய் முடியும் இல்லயா ? அதே போல தான் கட்டமைக்கப்படாத தகவல்கள் கொஞ்சம் கொஞ்சமாக சேர்ந்து மலைபோல மாறிவிடும்.

ஆயிரம் பேர் வேலை செய்யும் அலுவலகத்தில், ஒரு நபருக்கு தினம் பத்து அலுவல் சார்ந்த‌ மின்னஞ்சல் வரும் என வைத்துக் கொண்டாலும், மொத்தக்கணக்கு தினசரி பத்தாயிரம் மின்னஞ்சல்கள் என்றாகிறது. அது ஒரு மாதத்திற்கு மூன்று இலட்சம் என மிரட்டும் எண்ணிக்கையில் வந்து முடியும். அப்படி ஒரு ஆயிரம் நிறுவனங்களில் எவ்வளவாகும், தினசரி வருகின்ற மின்னஞ்சல்களின் எண்ணிக்கை அதிகமானால் என்னவாகும் என்பதையெல்லாம் மனக்கணக்கு போட்டு பார்த்துக் கொள்ளுங்கள்.

இதே போல புகைப்படங்கள், டாக்குமென்ட்கள், ஆடியோ ஃபைல்கள், டெக்ஸ் ஃபைல்கள், பிரசன்டேஷன்கள், வலைத்தளங்கள், போன் கால்கள் என ஒவ்வொரு விஷயத்தையும் எடுத்துக் கொண்டால் ‘ஒரு நிமிஷம் தலை சுத்திடுச்சு’ என்று நம்மையறியாமலேயே சொல்வோம்.

நமக்குக் கிடைக்கின்ற தகவல்களில் 70 முதல் 90 விழுக்காடு தகவல்களும் கட்டமைக்கப்படாத தகவல்கள் தான் ! அப்படிக் கிடைக்கின்ற தகவல்களை கட்டமைக்கப்பட்ட தகவல்களாக மாற்றுவது எப்படி என்பது தான்  தொழில்நுட்பம் எதிர்கொள்ளும் மிகப்பெரிய சவால். அதற்கான தொழில்நுட்ப நுணுக்கங்களை தகவல் அறிவியல் தன்னகத்தே முக்கிய இடத்தில் வைத்திருக்கிறது.

அலுவலகம் எனும் எல்லையைத் தாண்டினால்  சமூக வலைத்தளங்கள், வாட்சப் போன்ற குறுஞ்செய்தி செயலிகள், வலைத்தளங்கள், வீடியோ கால்கள், மின்னஞ்சல்கள், ஆன்லைன் பரிவர்த்தனைகள், சிக்னல் வீடியோக்கள் என இந்த தகவல்களின் வகைகளும், அளவுகளும் கோடி கைகளுடன் மனுக்குலத்தை இறுக்கப் பிடிக்கின்றன !

இந்த சவாலை, சாதகமாய் மாற்றும் வேலையைத் தான் தகவல் அறிவியல் செய்கிறது. இன்றைய தேதியில் வேலை வாய்ப்புகள் கொட்டிக் கிடக்கும் இடம் ‘டேட்டா சயின்ஸ்’ எனும் தகவல் அறிவியல் தான்

( தொடர்வோம் )

USB Drive : கொஞ்சம் தெரிஞ்சுக்கலாமா ?

Image result for USB

‘ஃபிளாப்பி டிஸ்ட்’ பார்த்திருக்கிறீர்களா ? நீங்கள் ‘இல்லை’ என்று சொன்னாலும் நான் ஆச்சரியப் படப் போவதில்லை. காரணம் இன்றைக்கு அது அருங்காட்சியகத்தில் ஆதிமனிதனைப் போல போல சைலன்டாகப் போய் அமர்ந்து விட்டது. ஆனால் ஒரு பத்து இருபது ஆண்டுகளுக்கு முன்பு நிலமை இப்படி அல்ல. ஃப்ளாப்பி டிஸ்க் ஒன்றைக் கையில் வைத்துக் கொண்டு சுற்றுவதை ஒரு கௌரவமாகவே பார்த்த தலைமுறை அது ! அதன் சேமிப்பு அளவே 1.44 மெகா பைட் தான் என்பதை நினைத்தால் வியப்பாக இருக்கும்.

இப்போது ஃப்ளாப்பி டிஸ்க் முற்றிலுமாக வழக்கொழிந்து போய்விட்டது. கணினி நிறுவனங்களும் தங்கள் கணினிகளை ஃப்ளாப்பியைப் பயன்படுத்தும் வகையில் உருவாக்குவதை நிறுத்தி விட்டார்கள். அதற்கு ஒரு காரணம் அதி விரைவாகவும், திறமாகவும், சக்தியுடனும் இருக்கும் யு.எஸ்.பி டிரைவ்கள் தான்.

எம்.சிஸ்டம்ஸ் எனும் இஸ்ரேல் நிறுவனத்தைச் சேர்ந்த அமிர் பார், டோவ் மோரான் மற்றும் ஓரோன் ஓக்டான் ஆகியோர் இணைந்து தான் இந்த யூ.எஸ்.பி ஃப்ளாஷ் டிரைவுக்கான முதல் முயற்சியின் வெற்றியைப் பகிர்ந்து கொண்டார்கள். ஏப்ரல் 1999ம் ஆண்டு அவர்கள் இதற்கான காப்புரிமையை வாங்கினார்கள். உலகம் 2000 எனும் மைல் கல்லை எட்டிய ஆண்டின் செப்டம்பர் மாதம் டிஸ்க்-ஆன் – கீ (Disk On Key ) எனும் பெயரில் முதல் தயாரிப்பையும் வெளியிட்டார்கள். சிங்கப்பூரிலுள்ள டிரெக் டெக்னாலஜி, நெட்டாக் டெக்னாலஜி போன்ற நிறுவனங்களெல்லாம் தாங்கள் தான் இதன் உண்மைச் சொந்தக்காரர்கள் என கேஸ் போட்டதும், மல்லுக்கு நின்றதும் இங்கே விவரிக்காத தனிக்கதை.

டிரக் டெக்னாலஜி, ஐபிஎம் போன்ற நிறுவனங்கள் 2000 ஆண்டில் தங்களது தயாரிப்பையும் சந்தையில் கொண்டு வந்தார்கள். இதில் டிரக் டெக்னாலஜி தனது தயாரிப்பை “தம்ப் டிரைவ்” (Thumb Drive) என்று பெயரிட்டு அழைத்தது. ஐபிஎம் தனது தயாரிப்பை டிஸ்க் ஆன் கீ என பெயரிட்டழைத்தது. முதலில் அது வெளியிட்ட தயாரிப்பில் சேமிப்பு அளவு 8 எம்பி தான். ஃப்ளாப்பி டிஸ்களை விட ஐந்து மடங்கு அதிக சேமிப்புத் திறன் என அப்போது கொட்டமடித்து அதை விற்றார்கள்.

இந்த சேமிப்பு கருவியின் சிறப்பு அம்சம் என்னவென்றால் இதிலுள்ள மெமரி பகுதிகளை மின் முறைப்படி அழிக்கலாம், மீண்டும் எழுதலாம் என்பது தான். EEPROM (Electrically Erasable Programmable read-only memory )  எனும் பழைய முறை தான் இதன் அடிப்படையில் இயங்கும் தொழில் நுட்பம். இந்த பழைய நுட்பம் பெரிய பெரிய மெமரி பகுதிகளை அழிக்கும் விதமாக உருவாக்கப்பட்டிருந்தது. புது யூ.எஸ்.பி டிஸ்க் களில் குட்டிக் குட்டி நினைவிடங்களைக் கூட துல்லியமாக அழிக்க முடியும். கூடவே பெரிய பிளாக் களை அழிப்பதும் மிக சுலபம். இதன் வேகம் அதிகமாய் இருக்க இவை தான் காரணம்.

நாம் இப்போதெல்லாம் கையில் வைத்திருக்கும் யு.எஸ்.பி ஃப்ளாஷ் டிரைவ்களில் பழைய காலத்தோடு ஒப்பிடும்போது பல ஆயிரம் மடங்கு அதிக தகவலைச் சேமிக்க முடியும். ஒரு சுண்டுவிரல் அளவுள்ள டிரைவ்கள் 256 ஜிபி கொள்ளளவு என்றெல்லாம் வியக்க வைக்கின்றன. நாளை இது பல டெராஃபைட், ஸீட்டா பைட் என எகிறிக் குதித்து ஓடும் என்பதிலும் எந்த சந்தேகமும் இல்லை. காரணம் 2 டெர்ரா பைட் அளவுள்ள பென் டிரைவ்களை உருவாக்கும் முயற்சி இப்போது நடந்து கொண்டிருக்கிறது

இந்த யூ.எஸ்.பி டிரைவ்களில் பெயரில் தான் ‘டிரைவ்’ இருக்கும். ஆனால் எதுவுமே நகராது என்பது இதன் பிளஸ் பாயின்ட் ! பழங்கால ப்ளாப்பி டிரைவ்கள், டிஸ்க்கள், சிடி ரோம்கள் போன்ற ஒட்டு மொத்த சங்கதிகளையும் தூக்கிச் சாப்பிட்டு ஏப்பம் போட்டுவிட்டது இந்த யூ.எஸ்.பி டிரைவ்.

இந்த யூ.எஸ்.பி டிரைவ்கள் சர்வதேச “யூ.எஸ்.பி மாஸ் ஸ்டோரேஜ்” தரத்தையே அடிப்படையாகக் கொண்டு செயல்படுகின்றன. இன்றைய பெரும்பாலான செயலிகளில் இயங்கக் கூடிய வகையில் அந்த தரநிர்ணயம் இருப்பது சிறப்பம்சம். வின்டோஸ் தவிர, லினெக்ஸ், மேக்,யுனிக்ஸ் போன்ற பல செயலிகளில் எந்தச் சிக்கலும் இல்லாமல் இது இயங்கும்.

ஒரு பிரிண்டட் சர்க்கியூட் போர்ட் இதனுள் இருக்கும் கூடவே ஒரு கனெக்டர். இந்த யூ.எஸ்.பி டிரைவ் வேலை செய்ய வேண்டுமென்றால் சக்தி தேவைப்படும். அந்த சக்தியை டிரைவ் ஆனது இணைக்கப்பட்டுள்ள கணினியிலிருந்தோ அல்லது வேறு மின் கருவிகளிலிருந்தோ தான் பெற்றுக் கொள்கிறது.

USB2.0 தான் மிகவும் பிரபலமான இரண்டாவது தலைமுறை யூ.எஸ்..பி இணைப்பு தொழில் நுட்பம். அதிகபட்சமாய் வினாடிக்கு 60 மெகா பைட் அளவுக்கு தகவல்களை இது எழுதவும், வாசிக்கவும் செய்யும். இதற்கு முந்தைய முதலைமுறை யூ.எஸ்.பி இணைப்பான USB 1.1 ன் சக்தி என்பது வினாடிக்கு 1.5 மெகா பைட் எனுமளவில் தகவல் பரிமாற்றத்தைச் செய்தது என்பது சுவாரஸ்யமான ஒப்பீட்டுச் செய்தி !

2008ம் ஆண்டு இதன் அடுத்த படியான USB 3.0 தயாரானது. வினாடிக்கு 625 மெகா பைட் என்பது இதன் அளவு. 2008ல் அறிமுகமானாலும் அது உடனே பயன்பாட்டில் வரவில்லை. 2010 ம் ஆண்டு முதல் இது பயன்பாட்டுக்கு வந்தது. இருந்தாலும் பழைய முறை முழுமையாக நிறுத்தப்படாமல் இன்னும் தொடர்கிறது.  இன்றைய கணினிகளை கவனித்தால் உங்களுக்கே தெரியும், அவையெல்லாம் USB 2.0 மற்றும் USB 3.0 எனும் இரண்டு வகை போர்ட் களுடனும் தான் தயாராகின்றன.

யூ.எஸ்.பி களில் முக்கியமாக நான்கு பாகங்கள் உண்டு. முதலாவது கணினிக்கும், ஃப்ளாஷ் டிரைவ்க்கும் இடையேயான தகவல் பரிமாற்றத்துக்கு உதவும் பிளக். இதை ஸ்டான்டர்ட் A யூ.எஸ்.பி பிளக் ( Standard A USB Plug) என்கிறார்கள். இரண்டாவது NAND ஃப்ளாஷ் மெமரி சிப். சாதாரண டிஜிடல் கேமராக்களில் பயன்படுத்தப்படுவது இந்தப் பகுதி மட்டும் தான். யூ.எஸ்பி மாஸ் ஸ்டோரேஜ் கன்ட்ரோலர். இதில் ஒரு சின்ன மைக்ரோ கன்ட்ரோலரும் இருக்கும். இது தான் யூ.எஸ்.பியின் செயல்பாடுகளை நெறிப்படுத்தும் பகுதி. இவற்றையெல்லாம் ஒரு பிளாஸ்டிக் அல்லது மெல்லிய உலோக ஆடைக்குள் அடைத்து விட்டால் நம் கையில் இருக்கும் ஃப்ளாஷ் டிரைவ் ரெடி !

ஃப்ளாஷ் டிரைவ்களில் இரண்டு விதமான தொழில் நுட்பம் பயன்படுத்தப்படுகிறது. இதை மல்டி லெவல் செல் (Multi Level Cell) மற்றும் சிங்கில் லெவல் செல் (Single Level Cell) என்று அழைக்கிறார்கள். பெரும்பாலான மெமரி கார்ட்கள் மல்டி லெவல் செல் அதாவது பல அடுக்கு சேமிப்பு எனும் நுட்பத்தின் அடிப்படையிலானவையே. மிகச் சுருக்கமாகச் சொல்ல வேண்டுமெனில் ஒரு நினைவிட துணுக்கில் ஒன்றுக்கு மேற்பட்ட தகவல்களைச் சேமிக்க முடிந்தால் அது மல்டி லெவல் சேமிப்பு. ஒரு தகவல் மட்டும் சேமிக்க முடிந்தால் அது சிங்கிள் லெவல் செல். மல்டி லெவல் செல்லில் நீங்கள் சுமார் 10 ஆயிரம் முறை தகவல்களை அழித்து அழித்து எழுதலாம். அதுவரை தாக்குப் பிடிக்கும். அதுவே சிங்கிள் எனில் ஒரு இலட்சம் தடவை நீங்கள் அழித்து எழுதினாலும் பாழாகாது என்பது வியப்பூட்டும் அம்சம்.

இன்றைக்கு இவை ரொம்பவே குட்டி வடிவத்துக்கு வந்து விட்டதால் பல வடிவங்களில் விற்பனைக்கு வந்துவிட்டது. பேனா, வாட்ச்கள், கத்தி, விளையாட்டுப் பொருட்கள், கீ செயின் என பலவற்றிலும் இந்த ஃப்ளாஷ் டிரைவ்கள் வந்து விட்டன.  இதில் ஏகப்பட்ட மேட் இன் டுபாக்கூர்கள் உண்டு என்பதை எப்போதும் நினைவில் கொள்ளுங்கள். எட்டு ஜிபி என கூவி விற்பார்கள். வாங்கி கணினியில் போட்டால் அது எட்டு ஜிபி என காட்டும். ஆனால் நீங்கள் சேமிக்கத் துவங்கும் போது கொஞ்சம் சேமித்த உடனே, “நான் ஃபுல் ஆயிட்டேம்”பா என கை விரிக்கும் ! எனவே இந்த டிரைவ் விஷயத்தில் நம்பிக்கையான தயாரிப்புகளை வாங்குவதே ரொம்ப நல்லது !

சரி இதை எதற்குப் பயன்படுத்தலாம் என்று கேட்டால் அடிக்க வருவீர்கள். இருந்தாலும் சொல்கிறேன். நமக்குத் தெரிந்ததெல்லாம் தகவல் சேமிப்பு தான். கொஞ்சம் எம்பி3 பாடல்கள், கொஞ்சம் திருட்டு வீடியோக்கள், அல்லது கொஞ்சம் டேட்டா ஃபைல்கள். இதைத் தாண்டிய பயன்பாடு ரொம்பவே குறைவு. ஆனால் தொழில்நுட்பம் இதை பல வேறு பயன்பாடுகளுக்குள்ளும் இட்டுச் செல்கிறது. சில மென்பொருட்கள் ஃப்ளாஷ் டிரைவகளில் வருகின்றன. அவை அங்கிருந்தே இயங்கவும் செய்கின்றன. கணினியில் மென்பொருட்களை நிறுவவேண்டும் எனும் தேவை இதன் மூலம் இல்லாமல் போய்விடுகிறது. இதை சாஃப்ட்வேர் விர்சுவலைசேஷன் (Software Virtualization) என்கிறார்கள்.

ஆப்பிள் இங்க். போன்ற சில நிறுவனங்கள் தங்கள் கணினியின் முழு ரீஸ்டோர் ஃபைல்களையும் இத்தகைய ஃப்ளாஷ் டிரைவ்களில் தந்து விடுகிறார்கள். ஒருவேளை கணினி பழுதாகிப் போனால் இந்த டிரைவைப் போட்டு இயக்க வேண்டியது தான் பாக்கி ! பழைய முறைகளான சிடி, டிவிடி போன்ற சமாச்சாரங்களெல்லாம் இதன் மூலம் ஓரங்கட்டப்பட்டு விட்டன.

இன்னொரு சுவாரஸ்யமான அம்சமாக இதில் காஃபியை ஊற்றி கணினியை உளவு பாக்கும் வேலையையும் செய்யலாம். நான் காஃபி (COFFEE) என்று சொன்னது Computer Online Forensic Evidence Extractor எனும் மென்பொருளை என முதலிலேயே சொல்லி விடுகிறேன். இதற்கு மேலும் நீங்கள் மெமரி கார்டில் காஃபி கொட்டினால் அதற்கு நான் பொறுப்பல்ல. இந்த மென்பொருள் டிரைவில் அமர்ந்து கொண்டு கணினியை முழுக்க வேவு பார்த்து சொல்லி விடும். கணினியிலுள்ள எந்த ஒரு அமைப்பையும் மாற்றாது !

அதே போல வின்டோஸ் தனது செயலியை ஒரு சின்ன டிரைவில் போட்டு “வின்டோஸ் டு கோ” என விற்பனை செய்வது இன்னொரு விஷயம். இவையெல்லாம் ஒரு சில சாம்பிள்களே, இத்தகைய பயன்கள் இன்னும் பல உண்டு.

இப்போது இத்தகைய பிளாஷ் டிரைவ் களிலும் பல அடுக்குப் பாதுகாப்புகள் வந்து விட்டன.. உங்கள் கைரேகை கொடுத்தால் தான் வேலை செய்ய ஆரம்பிப்பேன் என அடம்பிடிக்கும் பயோ மெட்ரிக் (Biometric) தொழில் நுட்பம் முதல், சொன்னதை குண்டக்க மண்டக்க என எழுதி மற்றவர்களைக் குழப்பும் என்கிரிப்ஷன்(Encryption) வரை எல்லாம் இதில் உண்டு. பயன்பாடு அதிகரிக்கும் போது பாதுகாப்பும் அதிகரிக்க வேண்டியது காலத்தின் தேவையல்லவா !

இன்றைக்கு யூ.எஸ்.பி டிரைவ் இல்லாத கணினிகளே கிடையாது. இதற்காக தனியே டிரைவர் மென்பொருட்களை நிறுவவேண்டும் எனும் காலமும் மலையேறிப் போய்விட்டது. எங்கும் எளிதில் தூக்கிச் செல்லலாம், கனம் குறைவு, பயன்பாடு அதிகம், சேதமாகும் வாய்ப்பு குறைவு போன்ற பல்வேறு நன்மைகள் இந்த டிரைவ்களின் பயன்பாட்டை வானளாவ உயர்த்தியிருக்கின்றன.

நீங்கள் அலட்சியமாய் பாக்கெட்டில் தூக்கிப் போட்டுத் திரியும் யூ.எஸ்.பி டிரைவ்க்குப் பின்னால் இத்தனை விஷயம் இருப்பதே வியப்பு தான் இல்லையா ? அடுத்த முறை கடைக்குப் போகும் போது  ‘யூனிவர்சல் சீரியல் பஸ் டிரைவ்” ஒண்ணு குடுங்க என கேட்டுப் பாருங்கள். புரியலையா ? யூ.எஸ்.பி யின் விரிவாக்கம் தான் “யூனிவர்சல் சீரியல் பஸ்” (Universal Serial Bus) என்பது ! உங்கள் மெமரியில் சேமித்து வைத்துக் கொள்ளுங்கள்.

I.O.T : நாளைய இணையம் !

Image result for IOT

“இன்டர்நெட் ன்னா என்னங்க ? ” என யாரிடமாவது கேட்டால் நம்மைப் பார்த்து அவர்கள் வயிறு வலிக்கச் சிரிக்கக் கூடும். “இந்தியாவுக்குச் சுதந்திரம் கெடச்சுடுச்சா?” என கேட்பதைப் போல அதரப் பழசான விஷயமாகிப் போய்விட்டது அது !

இணையம் வந்த காலத்தில் ஒரு மின்னஞ்சல் வைத்திருப்பது கௌரவமாகப் பார்க்கப் பட்டது. “ஒரு மெயில் அனுப்பிட்டு வரேன்” என்று சொல்லி விட்டு இன்டர்நெட் கஃபேக்குப் போவது அப்போதைய இளசுகளின் “ஸ்டைல்” ! அங்கே கியூவில் நின்று ஒரு மெயில் அனுப்பி விட்டு வருகையில் ஏதோ தொழில்நுட்பத்தையே கரைத்துக் குடித்த பெருமை அவர்கள் முகத்தில் மிளிரும்.

பிறகு கம்ப்யூட்டர்கள் விலை குறைந்தன. இணையத்தின் பயன்பாடு அதிகரிக்க ஆரம்பித்தது. கணினிகள் வீடுகளின் அறைகளுக்குள் வந்து விட்டன. போன் வயரைக் கனெக்ட் பண்ணி இன்டர்நெட்டில் கட்டை வண்டி மாதிரி பயணித்தோம். பிறகு அறைக் கணினிகள், மடிக்கணினிகளால் மவுசு இழந்தன. போன் வயர் டயல் இணைய சேவையானது பிராட்பேண்ட்களால் காணாமல் போச்சு.

பின்னர் டேட்டா கார்ட், வயர்லெஸ், பிராட்பேண்ட் வயர்லெஸ் என இணைய வகைகள் வந்து நிலமையை படு சுலபமாக்கிவிட்டன. இப்போது மடிக்கணினிகளும் மவுசை இழக்கத் துவங்கிவிட்டன. கைகளுக்கும், சட்டைப் பைகளுக்குமாய் ஓடித் திரியும் ஸ்மார்ட் போன்கள் இணையத்தை விரல் சொடுக்கில் தொட்டுத் திரும்புகின்றன.

இந்த நிலையைத் தாண்டி என்ன தான் வரப் போகிறது எனும் ஆர்வம் எப்போதுமே மனசில் இருக்கும். ஒரு சயின்ஸ் ஃபிக்ஷன் படம் போல ஏதோ ஒரு வசீகரம் நம்மை எப்போதுமே புரட்டிப் போடுகிறது இல்லையா ? அப்படி ஒரு வியப்பூட்டும் நிலையை இன்டர்நெட் ஆஃப் திங்க்ஸ் ( IOF : Internet Of Things ) உருவாக்கும்.

ஒரு தகவல் தேவைப்படுகிறது என வைத்துக் கொள்ளுங்கள். சட்டென “கூகிள்” பக்கத்துக்குத் தாவி வார்த்தையை டைப் செய்து மவுஸைச் சொடுக்குவீர்கள் இல்லையா ? அது உங்கள் விண்ணப்பத்துக்குத் தேவையான பக்கங்களை அள்ளிக் கொண்டு வந்து தரும். இப்போது டைப் கூட செய்யத் தேவையில்லை, பேசினாலே போதும் என்பது புது வரவு !

அப்படி வந்து சேரும் பக்கங்களில் உங்களுக்கு என்ன தேவையோ அதை எடுத்துக் கொள்ளலாம் என்பதே இன்றைய நிலை. இதில் அடிப்படை என்னவென்றால், தகவல்கள் இணையத்தில் இருக்க வேண்டும். யாரோ ஒருவர், எங்கோ ஒரு மூலையில் ஒரு தகவலை இணையத்தில் சேமித்து வைத்தால் மட்டுமே அதைப் பயன்படுத்த முடியும்.

அதுவும் தகவல்கள் மட்டுமே இப்போதைக்கு நமக்குக் கிடைக்கும் இல்லையா ? இதை இன்டர்நெட் ஆஃப் டேட்டா ( Internet of Data) எனலாம். அதாவது தகவல்களுக்கான இணையம்.

இதை அப்படியே கொஞ்சம் வசீகரக் கற்பனையில் விரித்துப் பாருங்கள். உலகில் இருக்கின்ற பொருட்கள் எல்லாமே ஏதோ ஒரு வகையில் இணைக்கப்பட்டிருந்தால் எப்படி இருக்கும் ? நம்ம வீட்டுக் கொல்லையில் இருக்கும் பலா மரம் முதல், வெள்ளை மாளிகையில் இருக்கும் ஒபாமா வீட்டு நாய்க்குட்டி வரை எல்லாமே இணைக்கப் பட்டிருந்தால் எப்படி இருக்கும் ? உலகிலுள்ள எந்தப் பொருளை வேண்டுமானாலும், ஒரு தனிப்பட்ட அடையாளத்தின் மூலம் கண்டறிய முடிந்தால் எப்படி இருக்கும் ? இப்படி எழுந்த ஏகப்பட்ட “எப்படி இருக்கும்” எனும் கேள்விகளுக்கான விடையாகத் தான் வரப் போகிறது “இன்டர்நெட் ஆஃப் திங்க்ஸ்” அல்லது பொருட்களின் இணையம்.

“இணையம் என்றால் என்ன ? “ உலக அளவிலான வலையமைப்பு ஒன்று கணினி நெட்வர்க்களை ஒரு நேர்த்தியான தகவல் பரிமாற்ற இணைப்பு மூலம் (TCP/IP) இணைப்பது. “பொருட்கள்” என்பது என்ன ? “நம்மைச் சுற்றியுள்ள ஸ்பெஷல் அடையாளம் உள்ள, அல்லது தனித்துவ அடையாளம் இல்லாத விஷயங்கள்”. இந்த இரண்டையும் இணைத்துப் பாருங்கள். நம்மைச் சுற்றியுள்ள எல்லா விஷயங்களையும் தனித்துவ அடையாளம் மூலம் இனம் காண முடியும் ஒரு வலையமைப்பு. இது தான் “இன்டர்நெட் ஆஃப் திங்க்ஸ்”. என்னால் சொல்ல முடிந்த மிக எளிய விளக்கம் இது தான். தெரிந்து வைத்துக் கொள்ளுங்கள், இன்டர்வியூக்களில் கேட்கப்படலாம் !

இதன் மூலம் உலகிலுள்ள பொருட்களுக்கெல்லாம் தனியே “அறிவு” வந்துவிடும். அதாவது செயற்கை அறிவு. உதாரணமாக இப்போதெல்லாம் காரில் ரிவர்ஸ் “சென்சார்கள்” இருப்பதை அறிவீர்கள் தானே. காரை பின்னோக்கி எடுக்கும்போது வண்டி எதிலாவது மோதுமா ?, எத்தனை தூரத்தில் தடை இருக்கிறது? என்பதை காரின் பின்னால் இருக்கும் சென்சார்கள் கவனித்துச் சொல்கின்றன. இதன் மூலம் காருக்கு ஒரு சின்ன “செயற்கை அறிவு” கிடைத்து விடுகிறது இல்லையா ? இப்படி ஒவ்வொரு சூழலுக்கும், ஒவ்வொரு பொருளுக்கும், ஒவ்வொரு இடத்துக்கும் செயற்கை அறிவு கிடைப்பது தான் விஷயம்.

இதன் மூலம் பொருட்களை அடையாளம் காண்பது மட்டுமல்லாமல், பொருட்கள் ஒன்றுடன் ஒன்று பேசிக்கொள்ளவும், சூழலோடு பேசிக்கொள்ளவும், தகவல்களைப் பரிமாறிக் கொள்ளவும் முடியும். குழப்பமாக இருக்கிறதா ? ஒரு சின்ன உதாரணம் சொல்கிறேன். கூகிள் கார் கேள்விப்பட்டிருப்பீர்கள். டிரைவரே இல்லாமல் தனியே ஓடக் கூடிய கார் அது. நீங்கள் எங்கே செல்ல வேண்டும் எனும் தகவலை அதனிடம் சொல்லிவிட்டால் கார் உங்களைக் கூட்டிக் கொண்டு பத்திரமாய் அந்த இடத்தில் கொண்டு சேர்க்கும்.

சில ஆயிரம் மைல் தூரங்கள் ஆனாலும் கார் தொடர்ந்து பயணிக்கும். டிராபிக் வரும்போது வண்டியை நிதானமாக்கும், சாலை ஓரங்களில் இருக்கும் சிக்னல்களைக் கவனித்து அதன்படி நடக்கும், ஸ்பீட் லிமிட் போர்ட்கள் இருந்தால் அதன் படி காரை இயக்கும். பெட்ரோல் தீரப் போகிறது எனில் சொல்லும். கூடவே அடுத்த பெட்ரோல் பங்க் எங்கே இருக்கிறது, எவ்வளவு நேரம் ஆகும் எனும் சகல ஜாதகத்தையும் சொல்லும். மதிய வேளை ஆனால், “இன்னும் நாலு மைல் தூரத்துல ஒரு பிரியாணி கடை வருது நிப்பாட்டவா ?” என கேட்கும். இப்படி சொல்லிக் கொண்டே போகலாம். சின்ன வயசில் படித்த அலாவுதீன் கதை உங்களுக்கு ஞாபகம் வருகிறதா ?

இங்கே, கார் அதைச் சுற்றியிருந்த சிக்னல் லைட், தகவல் போர்ட், டிராபிக், டைம், காலநிலை என பல விஷயங்களோடு “கம்யூனிகேட்” செய்தது. அதாவது உரையாடியது, அல்லது தகவலைப் பெற்றுக் கொண்டது ! அதன் மூலம் தனது வேலையை கட்சிதமாய் முடித்தது. இந்த முறையில் விபத்துகள் கணிசமாகக் குறையும் என கணித்திருக்கிறார்கள். இது இன்டர்நெட் ஆஃப் திங்ஸ் – ன் ஒரு சின்ன சாம்பிள்.

RFID – ஞாபகம் இருக்கிறதா ? NFC பற்றிப் பேசியபோது நாம் பார்த்தோம்.
ரேடியோ பிரீக்வன்ஸி ஐடன்டிபிகேஷன் ( Radio-frequency identification) என்பதன் ரத்தினச் சுருக்கம் தான் RFID. ஒரு பொருளிலுள்ள “டேக்” ( tag) வானொலி அலை மூலமாக ஒரு தகவலை பரிமாற்றுவது தான் இதன் அடிப்படை. காரில் போகும்போது காணும் ஒரு விளம்பரச் சுவரொட்டியிலுள்ள ஒரு டேக் உங்கள் கையிலுள்ள ஸ்மார்ட் போனுக்கு ஒரு தகவலைப் பரிமாற்றுவது இதன் மூலம் சாத்தியம். இந்த ஆர்.எஃப்.ஐ.டி தொழில் நுட்பம் தான் இன்டெர்நெட் ஆஃப் திங்க்ஸ் எனும் கனவுக்குக் கலர் அடிக்கப் போகிறது ! அத்தோடு இணைந்து உதவப் போவது பல வகையிலான சென்சார்கள்.

உணவு, போக்குவரத்து, அலுவலகங்கள், தண்ணீர் சப்ளை, உணவுப் பொருட்கள் மேலாண்மை போன்ற விஷயங்களில் இவை மிகப்பெரிய பணியைச் செய்ய முடியும் என்கின்றனர் வல்லுநர்கள். ஐ.பி.எம் போன்ற பெரிய நிறுவனங்களெல்லாம் இன்டெர்நெட் ஆஃப் திங்க்ஸ் எனும் சிந்தனையின் அடிப்படையிலான ஆயிரக்கணக்கான முயற்சிகளில் தீவிரமாக ஈடுபட்டுள்ளன என்பது கவனிக்கத் தக்கது.

ஜி.இ நிறுவனம் வெள்ளோட்டம் விட்ட “ஸ்மார்ட் ஹாஸ்பிடல் ரூம்” வியக்க வைக்கிறது. இந்த அறையை அறையின் மேல்கூரையில் பொருத்தப்பட்டிருக்கும் மூன்று சென்சார்கள் முழு நேரமும் கவனித்துக் கொண்டே இருக்கின்றன. அவை தகவல்களை ஒரு ஸ்பெஷல் மென்பொருளுக்கு பரிமாற்றிக் கொண்டே இருக்கின்றன. எத்தனை முறை டாக்டர்கள் வருகின்றனர், நர்ஸ்கள் வருகின்றனர் என்பதை அது கவனிக்கிறது. நோயாளியைத் தொடும் முன்பும், பின்பும் டாக்டர் கை கழுவவில்லையேல் “டாக்டர், நீங்க கை கழுவ மறந்துட்டீங்க” என குரல் கொடுக்கும். நோயாளி வலியால் துடித்தால் அவருடைய முக பாவனையை வைத்தே டாக்டருக்கு அவசரச் செய்தி அனுப்பும் ! ரொம்பப் பக்கத்தில் எந்த நர்ஸ் இருக்கிறாரோ அவரை உஷார் படுத்தும். ஆச்சரியமாய் இருக்கிறது இல்லையா ? இவையெல்லாம் வரப் போகும் மாற்றத்துக்கான படிகளே.

வீடுகளுக்குப் பொருத்தப்படும் வாட்டர் சிஸ்டம், அவசர காலத்தில் நம்மை எச்சரிக்கை செய்யும் சிஸ்டம், காலநிலை மாற்றத்தை முன்னரே கண்டறியும் திட்டம் என இந்த மாற்றத்தின் கிளைகள் பல இடங்களிலும் விரிவடைந்து கொண்டிருக்கின்றன.

தற்போது தயாராகி வரும் ஸ்மார்ட்போன், டேப்லெட் போன்றவை பெரும்பாலும் இந்த மாற்றத்தை ஏற்றுக் கொண்டு செயல்படக் கூடிய வகையிலேயே உருவாகின்றன. இந்தத் திட்டம் நிறைவேறவேண்டுமெனில் சர்வதேச அளவில் ஒருங்கிணைந்த அணுகுமுறை தேவை. குறிப்பாக செல்போன் சேவை நிறுவனங்கள், தயாரிப்பாளர்கள், தனியார் நிறுவனங்கள், வர்த்தக சேவைகள், இணைய சேவை நிறுவனங்கள், சமூக வலைத்தளங்கள் என நீளும் எல்லாரும் கைகோக்க வேண்டியது ரொம்ப முக்கியம் “குளோபல் பல்ஸ்” எனும் முயற்சியின் இயக்குனர் ராபர்ட் கிர்க்பேட்ரிக். இவர் இந்த ஒருங்கிணைப்பை “டேட்டா பிலன்ந்தராபி (data philanthropy) என பெயரிட்டு அழைக்கிறார்.

2020ம் ஆண்டு நிறைவேறிவிடும் எனும் கனவுடன் இன்டர்நெட் ஆஃப் திங்க்ஸ் எனும் முயற்சியை உலக நிறுவனங்கள் தொடர்கின்றன. இந்தக் கனவு பல சவால்களை எதிர்கொள்கிறது. ஒன்று மாறிவரும் தொழில் நுட்பம். ஆண்டு தோறும் நிகழும் பல்வேறு புதிய தொழில்நுட்ப மாற்றங்கள் திட்டத்தை அடிக்கடி மறுபரிசீலனை செய்து, புதுமைப்படுத்த வைக்கிறது. இரண்டாவது இதற்கு அதிகப்படியான ‘எனர்ஜி’ தேவைப்படும். அந்த சக்தியை இயற்கையிலிருந்து உருவாக்கும் சக்தி கொண்ட பொருட்களை உருவாக்குவது அவசியம். மூன்றாவது, இது தனி மனித சுதந்திரத்தை குழியில் போட்டுவிடும் எனும் அச்சம் ! இதைத் தவிரவும் ஏகப்பட்ட தொழில்நுட்ப சாவல்கள், தொழில் நுட்பம் சாராத சவால்கள் இதைச் சுற்றி உலவுகின்றன.

இங்கிலாந்திலுள்ள சவுத்ஆம்டன் பல்கலைக்கழக பேராசிரியர் நிகல் ஸேட்போல்ட் இது குறித்துப் பேசும்போது ரொம்ப உற்சாகமாகிவிடுகிறார். உலகம் இதுவரை காணாத ஒரு மிகப்பெரிய அறிவுப் புள்ளியாய் உருமாறிவிடும். உங்கள் பிரிட்ஜ் முதல் பிரிட்ஜ்க்கு உள்ளே இருக்கும் ஆப்பிள் வரை எல்லாமே தொடர்புக்குள் இருக்கும். “என்னைக் குடிக்காதே நான் காலாவதி ஆனவன்” என மருந்து பாட்டில் எச்சரிக்கும். இந்தப் பொருளை விட அடுத்த கடையில் இருக்கும் பொருள் விலைகுறைவு என பொருளே தகவல் சொல்லும். இப்படி ஒரு அறிவியல் புனைக்கதை போன்ற ஒரு உலகில் நீங்கள் உலவலாம். என வியக்க வைக்கிறார்.

இன்னும் சிறிது காலத்தில் “மூக்குக் கண்ணாடியை எங்கேடா வெச்சேன் பேராண்டி” எனக் கேட்கும் தாத்தாவுக்கு பேரன் “இன்டர்நெட் ஆஃப் திங்க்ஸ்” மூலம் தேடி எடுத்துத் தருவான் ! கட்டிலுக்கு அடியிலிருந்து.

அசத்தப் போகும், NFC !

Image result for NFC

பழைய கால “சூப்பர் ஸ்டார்” படங்களில் ஒரு காட்சி வரும். ஹீரோ ஸ்டைலாக கையைத் தூக்கி கதவை நோக்கி நீட்டுவார். கதவு திறந்து கொள்ளும். ஞாபகம் இருக்கிறதா ? கைத்தட்டல்களால் திரையே கிழிந்த காலம் அது ! இப்போது அப்படி ஒரு காட்சி வந்தால் நாம் கொட்டாவி தான் விடுவோம். காரணம், நமது அலுவலகங்களிலேயே தானே திறக்கும் கதவுகள் தான் இருக்கின்றன ! சென்சார்கள் கதவைத் திறந்து விடும் செக்யூரிடி வேலையை செவ்வனே செய்து விடுகின்றன !

அதே போல தான் அமானுஷ்ய படங்களில் சட்டென டிவி ஓடுவதும். டேப் ரிக்கார்டர் பாடுவதும் என வெலவெலக்க வைக்கும் டெக்னிக் அதரப் பழசு. யாரும் தொடாமலேயே டிவி ஓடுமா என திகிலடையும் மனசு இப்போ இல்லை. கையடக்க ஒரு குட்டி ரிமோட் கண்ட்ரோல் எல்லா வேலையையும் செய்கிறது இல்லையா ?

“இப்படி தொடாமலேயே இயங்கும்” தொழில் நுட்பம் ஒரு இனிய ஆச்சரியம். தொழில் நுட்ப வளர்ச்சியின் ஒரு முக்கியமான மைல் கல் என்று இதைச் சொல்லலாம். அது தான் “அட” என வியக்க வைக்கும் பல விஷயங்களைச் சாத்தியமாக்கித் தந்திருக்கிறது. செல்போன் முதல் வை-ஃபை(WiFi) எனப்படும் வயர்லெஸ் இணையம் வரை தொடாமல் தொடும் விஷயங்களே அக்கிரமித்திருக்கின்றன.

அதிலும் “வயர்லெஸ் இணையம்” சாத்தியமானதால் இன்றைக்கு தொழில் நுட்பம் சட்டென பல படிகள் பாய்ந்து முன்னேறிவிட்டது என்று கூட சொல்லலாம். மொபைல்கள், டேப்லெட்கள், ரீடர்கள் என எல்லா கருவிகளிலும் இப்போது வை ராஜா வை என “வை ஃபை” ஆட்சி தானே !

எப்போதும் அடுத்த கட்டத்தை நோக்கி புலிப் பாய்ச்சலாய் ஓடும் தொழில் நுட்பம் இணையம் வந்தபின் ராக்கெட் பாய்ச்சலாய் மாறியிருக்கிறது. அதன் தற்போதைய வசீகரிக்கும் அம்சம் தான் “நியர் ஃபீல்ட் கம்யூனிகேஷன்” (Near Field Communication – NFC ). அழகிய தமிழில் இதை அருகாமைத் தகவல் தொடர்பு என்று சொல்லலாம். பெயரைப் பார்த்தாலே புரிந்திருக்கும் இதன் பயன் என்ன என்பது !

சுருக்கமாகச் சொல்ல வேண்டுமென்றால், இரண்டு ஸ்மார்ட்போன்களை செல்லமாய் ஒன்றோடொன்று தொட்டுக் கொள்வதன் மூலம் தகவலைப் பரிமாறுவது தான் இந்த நியர் ஃபீல்ட் கம்யூனிகேஷனின் அடிப்படை. சுருக்கமாக என்.எஃப்.சி. தொட்டும் தொடாமலும் உங்க பேண்ட் பாக்கெட்டில் இருக்கும் பர்ஸை அபேஸ் செய்வார்கள் இல்லையா ? அதே போல தான் இங்கும் தகவல் பரிமாற்றம் இருக்கும் ! இரண்டு கருவிகள் ஒன்றோடொன்று தொடவேண்டும், அல்லது ரொம்ப ரொம்ப அருகில் உரசுவது போல வரவேண்டும். அப்போது தான் இங்கே தகவல் தொடர்பு சாத்தியம் !

மிக எளிமையான வழி. வயர்லெஸ், புளூடூத் போல இரண்டு கருவிகளுக்கு இடையே இணைப்பை ஏற்படுத்துவது, அது இது என எக்ஸ்ட்ரா டென்ஷன் ஏதும் இல்லை. ஜஸ்ட் லைக் தேட் தொட்டால் தகவல் பரவும் !

ரேடியோ அலைவரிசைத் தகவல் பரிமாற்றம் தான் இதன் உள்ளே ஒளிந்திருக்கின்ற தொழில் நுட்ப சீக்ரெட் ! ரேடியோ பிரீக்வன்ஸி ஐடன்டிபிகேஷன் ( Radio Frequency Identification ) ஸ்டான்டர்ட் இந்த தகவல் பரிமாற்றத்தின் அடிப்படை. ISO/IEC 14443 , FeliCa போன்றவையெல்லாம் இந்த ஸ்டான்டர்களில் சில.

என்.எஃப்.சி  தொழில் நுட்பம் சாதாரணமான கிரடிட் கார்ட், எலக்ட்ரானிக் காசோலை, மொபைல் பண பரிவர்த்தனை போன்ற அனைத்து விஷயங்களையும் அடுத்த தளத்துக்கு எடுத்துச் செல்லும். கூகிள் வேலட் (google wallet ) கேள்விப்பட்டிருக்கிறீர்களா ? அது இந்த நுட்பத்தின் படி தான் இயங்குகிறது.

உதாரணமாக, கடையில் பொருள் வாங்கிவிட்டு என்ன செய்வீர்கள் ? கிரெடிட் கார்டைக் கொடுப்பீர்கள் ! அவர்கள் அந்தக் கார்டை மெஷினில் தேய்த்து, உங்கள் கையெழுத்து உட்பட இன்ன பிற சங்கதிகளை வாங்கி விட்டு அனுப்புவார்கள். யாராச்சும் உங்களுடைய கார்டை லவட்டிக் கொண்டு போய் பொருள் வாங்கினாலும், சந்தோசமாக வழியனுப்பி வைப்பார்கள்.

என்.எஃப்.சி  அதை பாதுகாப்பாகவும், வசதியாகவும் மாற்றுகிறது. உங்களுடைய கார்ட் தகவல்கள் எல்லாமே உங்கள் மொபைலில் பாதுகாப்பாக இருக்கும். பொருள் வாங்கிவிட்டு போனை அந்தக் கருவியில் உரசினால் போதும். எவ்வளவு பணம் செலுத்த வேண்டுமோ செலுத்தலாம். ஒரு “பாஸ்வேர்ட்” வைத்துக் கொள்ளலாம். அவ்ளோ தான் ! இது ஒரு சின்ன உதாரணம்

என்.எஃப்.சி  பயன்பாடு எதிர்காலத்தில் மிரட்டக் கூடிய அளவில் இருக்கும் என்பது சர்வ நிச்சயம். உங்கள் வீட்டுக் கதவைத் திறக்க வேண்டுமானால் மொபைலினால் தொட்டால் போதும். சாவி இல்லாமலேயே பூட்டு திறந்து கொள்ளும். போனும் போனும் உரசிக் கொண்டால் அப்படியே விசிடிங் கார்டைப் பரிமாறிக் கொள்ளலாம். அப்படியே போட்டோக்களை பரிமாறிக் கொள்ளலாம். விமான டிக்கெட் போனில் இருந்தால் போதும் என இதன் பயன்கள் எக்கச் சக்கம்.

இதன் பயன்பாடு நவீன சமூக வலைத்தளங்கள் மற்றும் விளையாட்டு மென்பொருட்களில் சூடு பிடிக்க ஆரம்பித்திருக்கிறது.

எதிர்காலத்தில் வர்த்தகத்தில் என்.எஃப்.சி கொடி நாட்டும் என வர்த்தக ஜாம்பவான்கள் கற்பூரம் கொளுத்தி சத்தியம் செய்கிறார்கள். அதற்கு உதவுபவை இரண்டு விஷயங்கள். ஒன்று ஸ்மார்ட் போன், இன்னொன்று என்.எஃப்.சி டேக் (NFC Tag). என்.எஃப்.சி டேக் என்பதை பொருட்களில் இருக்கின்ற “பார் கோட்” போல நீங்கள் நினைத்துக் கொள்ளலாம்.  பல்பொருள் அங்காடிகளில் பொருள் வாங்கும் போது ஸ்கேன் செய்து பில் போட்டுத் தருவார்கள் இல்லையா ? அதோடு நீங்கள் ஒப்பிட்டுக்கொள்ளலாம்.

உதாரணமாக, காலையில் வீட்டுப் பேப்பரில் ஒரு ஸ்பெஷல் விளம்பரம் இந்த என்.எப்.சி டேக் சகிதம் வருகிறது என வைத்துக் கொள்ளுங்கள். உங்கள் போனை அதன் மேல் தொட்டால் உங்களுக்கு அது இன்னும் பல விஷயங்களை போனில் தரும். “சிங்கப்பூர் செல்ல இன்றைக்கு ஸ்பெஷல் ஆஃபர். உடனே டிக்கெட்டை வாங்குங்கள்” என ஒரு விளம்பரம் வருகிறது என வைத்துக் கொள்ளுங்கள். என்ன செய்வீர்கள். அந்த எண்ணுக்கு போன் பண்ணி விஷயத்தைக் கேட்பீர்கள். பிறகு அந்த அலுவலகத்துக்கோ, அல்லது ஆன்லைனிலோ உங்களுடைய டிக்கெட்களை புக் செய்வீர்கள். இது தானே வழக்கம்?

என்.எப்.சி டேக் விளம்பரமெனில் இதில் எதுவும் தேவையில்லை. உங்கள் போன் அந்த இணைப்பை வாசிக்கும். அப்படியே விவரங்கள் போனில் வரும். அங்கிருந்து உடனடியாக பணம் செலுத்தி டிக்கெட்டை வாங்கிக் கொள்ளலாம். ஒரு காபி குடிக்கும் நேரத்தில் எல்லாம் சுபம் ! அடுத்த லண்டன் ஒலிம்பிக் டிக்கெட்களை என்.எஃப்.சி  நுட்பத்தில் எளிதில் பெற்றுக் கொள்ளும் வசதியை இப்போதே சேம்சங் போன்ற செல்போன் நிறுவனங்கள் போட்டி போட்டு உருவாக்கி வருகின்றன.

கடை வீதிக்குப் போகிறீர்கள். போகும் வழியில் தெருக்களிலோ, கடை வாசலிலோ ஒட்டப்பட்டிருக்கும் என்.எப்.சி டேக் பக்கத்தில் உங்கள் போனைக் கொண்டு போய் “ஒரு கிலோ கத்தரிக்காய், நாலு கிலோ வெங்காயம்” என ஆர்டர் செய்து விட்டு வீட்டுக்கு அனுப்பச் சொல்லலாம். நீங்கள் வீடு வந்து சேரும் போது பொருட்களும் வந்து சேரும்.

ஜப்பான் போன்ற நாடுகளில் சில கடைகள் இதற்காகவே இருக்கின்றன. கடைகளில் பொருட்களே இருக்காது. போனால் படங்களும், அதன் விலையும், என்.எஃப்.சி விளம்பரமும் மட்டுமே இருக்கும். உங்களுக்கு எதெல்லாம் வேண்டுமோ அதையெல்லாம் தொட்டுக் கொள்ளுங்கள், பணத்தை போனிலேயே செலுத்துங்கள், வீட்டு அட்ரசைக் கொடுங்கள் வீட்டுக்கு பொருள் வந்து சேரும். வெண்டக்காயை ஒடிச்சுப் பாத்து தான் வாங்குவேன் என அடம்பிடிக்காதவர்களுக்கு இது ஒரு அற்புதமான ஷாப்பிங் ஐடியா !

பிரான்ஸிலுள்ள டோலோஸ் விமான நிலையத்தில் என்.எஃப்.சி மூலம் செக்-இன் செய்யலாம் எனும் வசதியை உருவாக்கியிருக்கிறார்கள். உங்களுடைய போர்டிங் பாஸ் எல்லாம் போனில் இருக்கும். கையை ஆட்டிக் கொண்டே விமானத்தில் ஏறுவது போல, போனை ஆட்டிக் கொண்டே உள்நுழைய அனுமதி பெறலாம் ! உலகிலேயே இந்த வசதி இந்த விமான நிலையத்தில் தான் முதன் முதலாக உருவாக்கப்பட்டிருக்கிறது என்பது ஸ்பெஷல் நியூஸ் !

2004ம் ஆண்டு மூன்று வர்த்தக ஜாம்பவான்கள் சோனி, நோக்கியா மற்றும் பிலிப்ஸ் இணைந்து இதற்கான வரைமுறையையும் விதிகளையும் நிர்ணயித்தார்கள். இன்று வரை அவையே என்.எஃப்.சியின் அடிப்படை விதிகளாக இருக்கின்றன ! இதெல்லாம் பழைய கால வரைமுறை. இதெல்லாம் மாற்றியாகவேண்டும் என்பதையும் நான் சொல்லியாக வேண்டும் !

அறிவியல் படித்திருக்கிறீர்களா ? “இன்டக்டிவ் கப்ளிங்” (Inductive coupling) பற்றிக் கேள்விப்பட்டிருக்கிறீர்களா ? எலக்ட்ரான்கள் ஒரு ஊடகம் வழியாகப் பாயும் போது ஒரு மின் காந்த தளத்தை உருவாக்கும். மின்காந்த தளம் மாறும் போது எலக்ட்ரான்கள் அதன் வழியாகப் பயணிக்கும். இந்த இரட்டை இயக்கம் தான் இன்டக்டிவ் கப்ளிங் எனப்படுகிறது. என்.எஃப்.சி தொழில்நுட்பத்தின் அடிப்படையும் இது தான். அதனால் தான் இந்த தொழில் நுட்பம் வேலை செய்ய வேண்டுமானால் கருவிகள் தொட்டுக்கொள்ளவேண்டும், அல்லது 4 சென்டீமீட்டர்களுக்குள் வரவேண்டும் எனும் விதி இருக்கிறது ! பத்து இருபது சென்டீமீட்டர்  வரை செயல்படும் என சிலர் வாதிடுவதுண்டு. எனினும் 4 சென்டீமீட்டர் என்பதே உத்தரவாத எல்லை !

ரேடியோ பிரீக்வென்சி ஐடென்டிபிகேஷன் (Radio frequency identification (RFID) ) பற்றிச் சொன்னேன் இல்லையா ? அதில் இரண்டு வகைகள் உண்டு. ஒன்று பேசிவ் ஆர்.எஃப்.ஐ.டி, இன்னொன்று ஆக்டிவ் ஆர்.எஃப்.ஐ.டி. இரண்டாவது வகை பேட்டரியால்  சார்ஜ் செய்யப்பட்டிருக்கும் என்பதே அதி முக்கியமான வித்தியாசம். இதனால் இந்த தொடுபிணைப்பு தூரம் கொஞ்சம் அதிகரிக்கப்படும் என்பது ஒரு ஸ்பெஷல் பயன். போகும் வழியில் பஸ்ஸில் இருந்தபடியே போஸ்டரில் இருக்கும் “இணைப்பை வாசித்து” பொருளை வாங்கும் நிலை ஒருவேளை வரலாம் !

தொழில் நுட்ப அடிப்படையில் இது 13.56 மெகா ஹெட்ஸ் அலைவரிசையில் இயங்கும். வினாடிக்கு 106 முதல் 424 கிலோபைட் அளவிலான தகவல்களை பரிமாற்றும். இது என்.எஃப்.சி சார்ந்த வர்த்தகத்துக்கு போதுமான அளவு என்பது குறிப்பிடத்தக்கது. இதை பயன்பாட்டு அடிப்படையில் மூன்று பிரிவுகளாகப் பிரிக்கிறார்கள். ஒன்று ரீட் அன்ட் ரைட் ( read and write ) விளம்பரங்களில் உள்ள இணைப்பை வாசிக்க இது பெருமளவில் பயன்படும். இரண்டாவது பியர் – டு – பியர் (peer to peer). இரண்டு செல்போன்களுக்கு இடையே தகவல் பரிமாற்றம் நடத்தும் விஷயம் இது. போட்டோக்கள், பாடல்கள், விசிடிங்கார்ட் போன்றவற்றை பரிமாறிக் கொள்வது போல!. மூன்றாவது கார்ட் எமுலேஷன் மோட் ( card emulation mode ) இது கிரெடிட் கார்ட் பயன்பாடு, டிக்கெட் வாங்குவது போன்ற விஷயங்களுக்குப் பயன்படுவது !

எதிர்காலத்தில் என்.எஃப்.சி நிச்சயம் ஒரு முக்கிய இடத்தைப் பிடிக்கும் எனும் நம்பிக்கை உங்களுக்கு வந்திருக்கும் என நினைக்கிறேன் ! இப்போதெல்லாம் வெளிநாட்டுச் சமாச்சாரங்கள் இந்தியாவிலும் உடனுக்குடன் இறக்குமதியாகின்றன. யார் கண்டது ? நாளை டவுன் பஸ்ஸில் டிக்கெட் எடுக்க நம்முடைய போன் பயன்படலாம் !