நவீன தீர்வுகள்

Related image

ஒரு
பிரச்சினையைத் தீர்ப்பது
மிகவும் எளிது.

முதலில்
அது
பிரச்சினையே இல்லை
என நம்ப வைக்க வேண்டும்

அதற்காக
அதைவிடப் பெரிய
பிரச்சினை ஒன்றை
உருவாக்க வேண்டும்.

அது
மெல்லும் வாய்களுக்கான
வசீகர
அவலாக இருக்க வேண்டும்.

ஊடகங்களின்
கவர்ச்சிப் பேச்சுக்கு
ஆவேச அனலாய்
கொதிக்க வேண்டும்.

அதற்காக
எளிய வழியாக
ஒரு
நடிகையின்
அந்தரங்கத்தை சபையேற்றலாம்.

ஒரு
சாதீய ஏழையைத்
துகிலுரியலாம்.

ஒரு
மத வன்முறையை
கலாச்சாரக் குடைபிடித்து
அரங்கேற்றம் செய்யலாம்.

ஒன்றும் இல்லையேல்
வெறுமையிலிருந்து
ஒரு
ஊகத்தை உருவியெடுக்கலாம்.

போதும்,
இனிமேல்
இந்தப் பிரச்சினை
எல்லா ஊடகங்களிலும்
தீக்குளிக்கும்.

எல்லா நரம்புகளிலும்
வெறியினை
இறக்குமதி செய்யும்.

பழைய
பிரச்சினை மறந்து போகும்.
அதை
பரணில் போட்டு மூடிவிடலாம்.

அப்போ,
புதிய பிரச்சினையை
தீர்க்கும் வழி ?

ஒரு
பிரச்சினையைத் தீர்ப்பது
மிகவும் எளிது.

முதலில்…

*

சேவியர்

 

Advertisements

Article : உனக்கு நீயே நீதிபதி.

Image result for man thinking

சொர்க்கத்தில் நுழைவதற்காக கடவுளின் முன்னால் எல்லோரும் வந்து நிற்கின்றனர். அப்போது ஒரு அறிவிப்பு வருகிறது. “சொர்க்கத்தில் உள்ள சட்டதிட்டங்களில் ஒரு சின்ன மாறுதல். அதன் படி பாலியல் குற்றம் என்பது குற்றப்பட்டியலில் இருந்து நீக்கப்படுகிறது. பூமியில் பாலியல் குற்றம் செய்தவர்களும் சுவர்க்கத்தில் நுழையலாம்”

அறிவிப்பைக் கேட்டவுடன் கூட்டத்தில் நின்றிருந்தவர்களில் பாதி பேர் , “அட… சே.. நல்ல வாய்ப்பை வீணடிச்சுட்டோமே” என மனதில் நினைத்தார்கள். உடனே அடுத்த அறிவிப்பு வந்தது.

“வாய்ப்பை மிஸ் பண்ணிட்டோமே என நினைத்தவர்களெல்லாம் நரகத்துக்கும், மற்றவர்களெல்லாம் சொர்க்கத்துக்கும் வரலாம் “

வேடிக்கையாகச் சொல்லப்பட்ட கதையாக இருந்தாலும் இது சொல்ல வருகின்ற அடிப்படைக் கருத்து என்னவென்றால், “நமது மனதை நாமே வகைப்படுத்தாவிடில் அதனால் பயனில்லை” என்பது தான். வேர்களைக் கவனிக்காவிடில் கனிகள் சுவையாக இருக்காது என்பது தான்.

வெளிப்புறமான சட்டங்களோ, திட்டங்களோ, கட்டாயங்களோ, கண்டிப்புகளோ கொண்டு வருகின்ற மாற்றமானது உள்ளார்ந்த மாற்றத்தை உருவாக்குவதில்லை. மாற்றம் என்பது உள்ளில் உருவாகி வெளிப்படும் போது தான் அது மிகுந்த கனிகொடுக்கின்ற வாழ்க்கையை நமக்குத் தருகிறது.

நமக்கு நியாயமாகத் தீர்ப்பு வழங்கக்கூடியவர்கள் இரண்டே இரண்டு பேர் தான். ஒன்று கடவுள், இன்னொன்று நாம். காரணம், பிறர் நம்மை கணிப்பது நமது வெளிப்படையான செயல்களை வைத்துத் தான். ஆனால் நமக்கு மட்டுமே தெரியும் நமது உள்ளார்ந்த சிந்தனைகள்.

ஒருவரை நோக்கிப் புரிகின்ற புன்னகையை மொழிபெயர்த்தால் என்ன கிடைக்கும் என்பது நமக்கு மட்டுமே தெரியும். அதன் பின்னால் விகாரத்தின் கோரப் பற்கள் மறைந்திருக்கலாம். எரிச்சலின் எரிதழல் ஒளிந்திருக்கலாம். வெறுப்பின் குத்தீட்டிகள் குனிந்திருக்கலாம். பொறாமையின் புலி நகங்கள் புதைந்திருக்கலாம். அது நமக்கு மட்டுமே தெரியும். ஒரு புன்னகை புனிதமானது, அதன் பின்னணி புனிதமா என்பதை யாரும் அறிவதில்லை.

அல்லது நாம் ஒருவருக்கு உதவி செய்ய முன்வரலாம். அதன் பின்னால் மனிதத்தின் இழைகள் இருப்பதாகவே சமூகம் கருதிக் கொள்ளும். ஒருவேளை அதன் பின் நமது பெருமையின் வேர்கள் பற்றியிருக்கலாம். சுயநலத்தின் சன்னல்கள் திறந்திருக்கலாம். அல்லது கட்டாயத்தின் சட்டங்கள் கூட மறைந்திருக்கலாம். அதை அறிவது நாம் மட்டுமே.

இப்படி ஒவ்வொரு விஷயத்திலும் நம்மைப் பற்றிய தெளிவான குற்றப்பத்திரிகையை எழுத நம்மால் மட்டுமே முடியும். தெளிவான குற்றப்பத்திரிகைகளே நமது வாழ்வில் இருக்கின்ற குற்றங்களைக் குறித்த புரிதல்களை நமக்குத் தரும். குற்றங்கள் குறித்த தெளிவே அதை விலக்க வேண்டும் எனும் உந்துதலைத் தரும். அந்த உந்துதலே புனிதத்தை நோக்கிய நமது பயணத்தின் அடிப்படை விஷயம்.

தவறு செய்யவே வாய்ப்பில்லாத ஒரு இடத்தில் நேர்மையாளனாய் இருப்பதில் ஆச்சரியமில்லை. ஆனால் தவறு செய்ய அத்தனை வாய்ப்புகளும் கொட்டிக் கிடக்கின்ற ஒரு இடத்தில் நேர்மையாளராய் இருக்கிறீர்களா என்பதில் தான் நமது வாழ்க்கை அளவிடப்படுகிறது.

அது அலுவலக பேனாவை சொந்த வேலைக்காகப் பயன்படுத்துவதாய் இருந்தாலும் சரி, நேசித்த ஒருவரை உள்ளூர வெறுப்பதானாலும் சரி. சின்ன விஷயமோ, பெரிய விஷயமோ நமது மனமே நம்மை இயக்குகிறது.

மனம் எனும் குதிரைக்கு இடுகின்ற கடிவாளங்கள் வாழ்க்கை எனும் பயணத்தில் வெளிப்படுகின்றன. அந்த கடிவாளங்கள் நமது இயல்பிலிருந்து வெளிப்படும் போது வாழ்க்கை இனிமையாகிறது. அந்த கடிவாளங்கள் கட்டாயத்தின் கட்டுகளாகும் போது வாழ்க்கை வலிமிகுந்ததாகிறது.

நமது வாழ்க்கைக்கு நாமே நீதிபதியாக இருக்க வேண்டும். நம்மை வனையும் குயவனாக நாமே இருக்க வேண்டும். நம்மைச் செதுக்கும் சிற்பியாக நாமே இருக்க வேண்டும். அப்போது தான் நமது வாழ்க்கை அர்த்தமுடையதாகும்.

நமக்கு நாமே நீதிபதியாக இருக்கும்போது, சட்டங்கள் இல்லாவிட்டாலும் நேர்மையாக வாழவேண்டுமெனும் உந்துதல் இருக்கும். யாரும் பார்க்காவிட்டாலும் நம்மை நாமே பார்த்துக் கொள்கிறோம் எனும் எச்சரிக்கை உணர்வு இருக்கும். நமது தவறுகளுக்கான தண்டனையை நாமே பெற்றுக் கொள்ளவேண்டும் எனும் தார்மீக சிந்தனை இருக்கும்.

நமக்கு நாமே நீதிபதியாகும் போது, பிறருக்கு எதிராக நாம் தீர்ப்புகளை எழுத மாட்டோம். அவர்களுக்கு எதிராக அவர்களே வாதிடுவார்கள், தீர்ப்பிடுவார்கள். பிறருடைய வாழ்க்கையில் தேவையற்ற தலையீடுகளைச் செய்யாமல் இருக்கும் போது சமூக பிணைப்பு வலுவடையும்.

ஒவ்வொரு மரமும் செழிப்பாக இருக்கும்போது கானகம் செழிப்பாக இருக்கும். ஒவ்வொரு துளியும் புனிதமாக இருக்கும் போது நதியின் மொத்தமும் தூய்மையாக இருக்கும். ஒவ்வொரு மனிதரும் தன்னைத் தானே செதுக்கும் போது சமூகம் வலிமையாய் இருக்கும்.

நமது பலவீனங்களை மன்னிக்கும் நீதிபதியாக நாம் மாறும் போது, பலவீனங்களை பலங்களாய் மாற்றும் வாய்ப்புகள் கிடைக்கும். நமது பலங்களை நாமே பாராட்டிக் கொள்ளும் போது நமது பலங்களை பயன்களாக மாற்றிக் கொள்ளும் உறுதி உருவாகும். நமது குறைகளை நாமே செதுக்கும் போது நமது வாழ்க்கை அர்த்தம் பெறும்.

ஆனால் ஒன்று, நமக்கு நாமே நீதிபதியாய் மாறுவது, நமது தவறுகளுக்கு அனுமதி வழங்க அல்ல, நமது பிழைகளுக்கு அங்கீகாரம் கொடுக்க அல்ல, நமது குற்றங்களை கண்டுகொள்ளாமல் இருக்க அல்ல. நம்மை நாமே சீர்தூக்கிப் பார்த்து சரிசெய்ய.

ஒவ்வொரு நாளும் நமது செயல்களை நமக்கு முன்னால் கொண்டு நிறுத்தி வாதியாகவும், பிரதிவாதியாகவும் நாமே வாதிடுவோம். அந்த வாதம் நேர்மையாய் இருக்கட்டும். அப்போது நமது பிழைகளும், நமது நல்ல செயல்களும் நமக்கே புரியவரும். அதற்கான தீர்ப்பை நாமே எழுதுவோம்.

நம்மை நாமே சரியாகத் தீர்ப்பிடும்போது சமூகம் நம்மை தவறாகத் தீர்ப்பிடுவதில்லை. நம்மை நாமே திருத்திக் கொள்ளும் போது சமூகம் நம்மை உடைப்பதில்லை. அந்த பணியை நாம் கைக்கொள்ள வேண்டும்.

நமக்கு நாமே நீதிபதியானால்
பிறருக்கு நாம் குற்றவாளியாவதில்லை.

*

நீ யார்

Image result for who am I

நீ
யார் என்பதை
நீயறிவாய்.

பிறருடைய
அடைமொழிகளுக்கெல்லாம்
அடம்பிடிக்க வேண்டிய
அவசியமில்லை.

பிறருடைய
துருவேறிய தூற்றல்களுக்காய்
துயரப்படவும்
தேவையில்லை.

சூரியனை
நிலாவென
பெயர்மாற்றம் செய்யலாம்
அதன்
கதிர்களை எங்கே
கடத்திச் செல்வாய் ?

கடலை
வெறும் மண்மேடென்று
சட்டமும் இயற்றலாம்
உப்பு நீரை
எங்கே கொண்டு
ஒளித்து வைப்பாய் ?

நிலத்தின்
நிறம் கண்டு
விதைகள்
முளை விடுவதில்லை

நிலம் மாறி
நட்டதால்
ரோஜா
கருப்பாவதும் இல்லை.

நீ
என்பது
உனது இயல்பு.

பிறருடைய
மோதிரங்களுக்காய்
உன்
விரல்களை
வெட்டிக் கொள்ள வேண்டாம்.

மழை இல்லையென
தோகை
கத்தரிப்பதில்லை
மயில்.

வெயில் இல்லையென
தற்கொலை
செய்து கொள்வதில்லை
நிலா.

இயல்புகள்
இறக்காதவரை
மின்மினிகளும்
இரவைக் கிழிக்கும்.

இயல்புகள்
தொலைந்து போனால்
கூண்டில் சிங்கமும்
தூண்டிலில் உயிர்விடும்.

ஒன்றை மட்டும்
புரிந்து கொள்.

நீ யார்
என்பது
அடுத்தவனின்
கேள்விகளுக்கான விடையல்ல.

உனது
விடைகளுக்கான கேள்வி.

*

சேவியர்

குழந்தைகளுக்கு ஒரு ஆசிரியரின் கவிதை

Image result for beautiful kids

குழந்தைகள்

*

இதோ,
மீண்டும் மலர்ந்து விட்டது
ஒரு
குழந்தைகள் தினம்.

இது
உங்களுக்கான தினம்.

மலர்களே
தங்களுக்கு
மாலை சூடிக் கொள்ளும் தினம்

குயில்களே
தங்களுக்காய்
இசைவிழா நடத்தும் தினம்

இந்த
மயில்களுக்காய்
மழையொன்றைப் பொழிகிறேன்
கவிச்
சாரலை தெளிக்கிறேன்.

குழந்தைகளே
குழந்தைகளே
இன்றைய நாட்டின்
இளவரசர்களே

நாளைய
சிம்மாசனங்களின்
சொந்தக்காரர்கள் நீங்கள்,
நாளைய
சிகரங்களின்
கிரீடங்கள் நீங்கள்.

நீங்கள்
நாளைய வனத்துக்கான
இன்றைய விதைகள்.

நாளைய கடலுக்கான
இன்றைய துளிகள்

செதுக்குவதைப்
பொறுத்து தான்
சிலைகள் வடிவாகும்.

உங்களைக்
கவனமாய்ச் செதுக்கும்
கல்வி உளி
எங்களிடம் இருக்கிறது.

பொறுமையாய் காத்திருங்கள்
காத்திருக்கும்
பாறைகளே சிலைகளாகும்.
முரண்டு பிடிப்பவையோ
உடைந்து தெறிக்கும்.

நீங்கள்
மலர்கள்.

எந்த வாசனையை
உங்களில் ஊற்றுகிறோமோ
அதுவே
உங்கள்
சொந்த வாசனையாகப் போகிறது.

நேசத்தின்
வாசனையை
உள்ளத்தில் நிறையுங்கள்.

நீங்கள்
புல்லாங்குழல் போன்றவர்கள்
நாங்கள்
உங்கள் குணாதிசயங்களில்
இசை மீட்டும்
இடுபவர்கள்.

உங்களை
ஒப்படையுங்கள்,
வாழ்க்கை சுரம் விடுக்கும்.

மேகத்தை அரைத்தால்
மழை பொழியாது
ஏட்டுச் சுரைக்காய்
கறிக்கு உதவாது !
கற்பதை மனதில்
கல்வெட்டாய் கல்லுங்கள்.

நீங்கள்
சூரியனையும் முளைப்பிக்கும்
சக்தி படைத்தவர்கள்

பாதாளத்தையும் புதைத்து வைக்கும்
வலிமை படைத்தவர்கள்.
சோம்பலில் படுக்கையில்
சுருண்டு விடாதீர்கள்.

வெளியாறாத சூரியன்
ஒளிதருவதில்லை.
ஓடாத நதியில்
இசை இருப்பதில்லை.
இயங்கிக் கொண்டே இருங்கள்

நீங்கள்
வானத்தையும் வனையும்
வல்லமை படைத்தவர்கள்
விரல்களை
டிஜிடல் கருவிகளில்
ஒட்டி வைக்க வேண்டாம்.

கீழ்ப்படி இல்லாமல்
மேல்படி இல்லை
கீழ்ப்படிதல் இல்லாமல்
முன்னேற்றம் இல்லை.
கீழ்ப்படியுங்கள்.

பொய்யின் பிள்ளைகள்
வெற்றிகளின்
கிளைகளில் கூடுகட்டுவதில்லை.
வாய்மையை
வாழ்க்கையாக்கிக் கொள்ளுங்கள்.

கர்வத்தின் கரங்களில்
நெரிபடாதீர்கள்
தாழ்மையின்
தாழ்வாரங்களில் மட்டுமே
நடை போடுங்கள்.

மன்னிப்பின்
மகரந்தங்களைச்
சுமந்து செல்லும்
பட்டாம்பூச்சியாகுங்கள்.

ஒரு சிறு துளியே
பெருமழையின்
துவக்கம்.
ஒரு சிறு தவறே
பெருங்குற்றத்தின்
துவக்கம்
தவறுகளின் முளைகளை
துவக்கத்திலேயே
தறித்தெறியுங்கள்.

வாழ்க்கை
ஸ்மார்ட்போன்களில் இல்லை
அவை
உங்கள்
வலிமையை அழிக்கும்
மௌனச் சாத்தான்கள்.
வளரும் வரைக்கும் விலக்கியே வையுங்கள்.

விரைவில் தூங்கி
விரைவில் எழுங்கள்,
உடலை மதித்து
பயிற்சி எடுங்கள்,
நல்ல உணவால்
நலத்தைப் பெறுங்கள்

ஒரு துளி
விஷம் போதும்
உயிரை எடுக்க,
ஆரோக்கிய வாழ்வை
விலக்காமல் இருங்கள்.

நீங்கள்
குயவன் கை களிமண்.
வனையும் பொறுப்பு
எங்களிடம் இருக்கிறது.

எங்கள்
கரங்களை விட்டு
நழுவாமல் இருங்கள்
வழிகளை விட்டு
வழுவாமல் இருங்கள்

நீங்கள்
பாத்திரங்கள்,
உச்சமானதை மட்டுமே
உள்ளத்தில்
மிச்சமின்றி நிறையுங்கள்.

பிரபஞ்சத்தின்
பரவசமாம் புன்னகையை
உயிருக்குள்
நிரப்பியே வைத்திருங்கள்

இனிய
குழந்தைகள் தின
வாழ்த்துகள்

*

Data Science 8 : தகவல் அறிவியல் 8

எதிர்காலத்தில் தகவல் அறிவியல்

Image result for data science

எந்த ஒரு தொழில்நுட்பமும் கல்வெட்டு போல நிலைத்து நிற்பதில்லை. நாட்கள் செல்லச் செல்ல அந்த நுட்பம் தனது முக்கியத்துவம் இழந்து விடுகிறது. அப்போது இன்னொரு தொழில்நுட்பம் அந்த இடத்தை ஆக்கிரமித்துக்  கொள்ளும். அதுவும் இன்றைய டிஜிடல் யுகத்தில் தொழில்நுட்பத்தின் மாற்றங்கள் எக்ஸ்பிரஸ் வேகத்தில் தான் நிகழ்கின்றன.

தகவல் அறிவியல் தொழில்நுட்பமும் அப்படித் தான் இன்று இருப்பதைப் போலவே எல்லா நாளும் இருக்கப் போவதில்லை. மாற்றங்களை நிச்சயமாகச் சந்திக்கப் போகிறது, புதிய புதிய வடிவங்களை எடுக்கப் போகிறது. புதிய புதிய தொழில்நுட்பங்களோடு தன்னை இணைத்துக் கொள்ளப் போகிறது.

ஆர்டிஃபிஷியல் இன்டலிஜென்ஸ் எனப்படும் செயற்கை அறிவு அதில் முக்கியமான ஒன்று. அது கண்டிப்பாக இன்னும் ஆழமாக தகவல் அறிவியல் துறைக்குள் நுழையும் என்பதில் சந்தேகமில்லை. அப்போது அல்காரிதங்களும், மென்பொருட்களும் தன்னிலே “ஸ்மார்ட்” ஆக மாறி தகவல்களை பயன்படுத்தத் துவங்கிவிடும். மனித உதவி தேவையில்லாமலேயே பின்னர் ‘பிரடிக்டிவ்’ அலசல்கள் நடக்க வாய்ப்புகள் அதிகம்.

ஆர்டிபிஷியல் இன்டெலிஜென்டின் வரவு தகவல் அறிவியலில் ஏற்படுத்துகின்ற விளைவுகளில் ஒரு எதிர் விளைவும் உண்டு. எப்போது செயற்கை அறிவு முழுமையாக தகவல் அறிவியலில் நுழைகிறதோ அப்போது மனித உழைப்புக்கு அங்கே வேலை குறைகிறது. ஆட்டோமேஷன் அந்த இடத்தை வந்தடைகிறது. இதனால் அந்த காலகட்டத்தில் வேலை வாய்ப்புகள் குறையும். ஆனால் அதுவரை தகவல் அறிவியலார்களுக்கான தேவை அதிகரித்துக் கொண்டே இருக்கும்.

அதே போல மெஷின் லேர்னிங் எனப்படும் தொழில்நுட்பமும் இன்னும் அதிகமாக தகவல் அறிவியலில் இணைந்து கொள்ளும். ஏற்கனவே மெஷின் லேர்னிங் நுட்பம் டேட்டா சயின்ஸோடு இணைந்து தான் பயணிக்கிறது. இனிமேல்  இன்னும் அதிகமாக அந்த பிணைப்பு இருக்கும்.

உதாரணமாக ஒரு இயந்திரம் தனது தகவலை இன்னொரு இயந்திரத்துக்கு தானாகவே அனுப்பும், ஒரு கருவி வேறு பல கருவிகளிலிருந்து வருகின்ற தகவல்களை தானாகவே சேகரித்து அலசலை துவங்கும். சென்சார்களின் தகவல்கள் அங்கும் இங்கும் தானாகவே கூடு விட்டுக் கூடு பாய்ந்து தனது பணிகளைச் செய்யும். என இந்த மெஷின் லேர்னிங் நுட்பம் தகவல் அறிவியலில் வெகு ஆழமாய் செல்லும் என்பதில் சந்தேகமே இல்லை.

மருத்துவத் துறையில் தகவல் அறிவியலின் பயன் இன்னும் பல மடங்கு அதிகரிக்கப் போகிறது. குறிப்பாக நியூரல் நெட்வர்க் எனும் நரம்பியல் துறையில் தகவல் அறிவியலின் பயன்பாடு வெகுவாக அதிகரிக்கும் என மருத்துவ அறிக்கைகளும், ஆய்வுகளும் தெரிவிக்கின்றன.  மருத்துவம் ஏற்கனவே தகவல் அறிவியலை ஆய்வுகளிலும், மருத்துவமனைகளிலும் பயன்படுத்தி வருகிறது. அது இன்னும் பலமடங்கு அதிகரிக்கும்.

இன்டர்நெட் ஆஃப் திங்க்ஸ் எனும் தொழில்நுட்பம் பற்றி கேள்விப்பட்டிருப்பீர்கள். இப்போது கணினி துறையில் படிப்பவர்களுக்கு இது ஒரு கட்டாயப் பாடமாகவும் இருக்கிறது. எப்படி இணையத்தில் தகவல்களை சேமிக்கிறோமோ, அப்படி உலகில் நாம் பயன்படுத்தும் பல்வேறு பொருட்களையும் இணையத்தோடு இணைப்பது தான் இதன் அடிப்படை சிந்தனை. உதாரணமாக உங்கள் வீட்டு கேஸ் ஸடவ்வை நீங்கள் இணையத்தோடு இணைக்கலாம். அது ஒழுங்காக வேலை செய்கிறதா என்பதைக் கவனிக்கலாம்.

இவற்றையெல்லாம் சென்சார்கள் கவனித்துக் கொள்கின்றன. டிஜிடல் தகவல்களை அவை கணினிகளுக்கோ, அல்லது அது போன்ற கருவிகளுக்கோ அனுப்பி இணைய உலகோடுள்ள உறவை உயிர்ப்பித்துக் கொள்கின்றன. இன்றைக்கு சுமார் 170 பில்லியன் எனுமளவில் இருக்கும் இன்டர்நெட் ஆஃப் திங்க்ஸ் பிஸினஸ் இன்னும் நான்கு ஆண்டுகளில் சுமார் 560 பில்லியன் எனுமளவுக்கு எகிறும் என்கின்றன ஆய்வுகள்.

அதே போல பிக் டேட்டா எனும் தொழில்நுட்பமும் தகவல் அறிவியலின் ஒரு பாகம் தான். பிக் டேட்டா என்பது உங்களுக்குத்  தெரிந்த விஷயம் தான். கொட்டிக் கிடக்கின்ற கணக்கற்ற தகவல்களை எப்படி பயனுள்ள தகவல்களாக மாற்றுகிறோம் ? எப்படி அவற்றைக் கொண்டு தொழிலை வளர்ச்சிப் பாதையில் அழைத்துச் செல்கிறோம் என்பது தான் அதன் அடிப்படை. முழுக்க முழுக்க தகவல்களின் அடிப்படையில் இயங்குவதால் இது தொடர்ந்து தகவல் அறிவியலில் ஒரு முக்கியமான பாகமாக இருக்கும் !

வெறும் எண்களையும், டிஜிடல் எழுத்துகளையும் வைத்து தான் இன்றைக்கு தகவல் அறிவியல் அசத்திக் கொண்டிருக்கிறது. மற்றெந்த வகை தகவல்களாய் இருந்தாலும் அவற்றை முதலில் டிஜிடல் எண்களாகவோ, எழுத்துகளாகவோ மாற்றினால் தான் பயன்பாட்டுக்குக் கொண்டு வர முடியும் எனும் சூழல் இருக்கிறது. இந்த நிலை மாறும் !  இனி வரும் காலங்களில் தகவல்களை டிஜிடல் எண்களாக மாற்றாமல் நேரடியாகவே பயன்படுத்தக் கூடிய நுட்பங்கள் உருவாகும்.

அப்படிப்பட்ட மாற்றம் வரும்போது தகவல் அறிவியலில் இன்னும் வியப்பூட்டும் விஷயங்கள் நடக்கும். ஆடியோக்கள், வீடியோக்கள், புகைப்படங்கள், லைவ் கேமராக்கள் போன்றவை எல்லாமே மிகப்பெரிய நேரடியான உள்ளீடு தகவல்களாக பயன்படும். தகவல் அறிவியலின் மிகப்பெரிய புரட்சி அது என சொல்லலாம்.

அத்துடன் ‘நேட்டிவ் லேங்குவேஜ்’ எனப்படும் மொழிகடந்த தகவல் அறிவியலும் உருவாகிவிட்டால் இதன் வீச்சு கணிக்க முடியாத அளவுக்கு இருக்கும்.

ஹைப்பர் பெர்சனலைசேஷன் எனப்படும் தனிமனிதனை மையப்படுத்தி செய்கின்ற தொழில்களுக்கு தகவல் அறிவியல் தான் மிகப்பெரிய துணையாய் இருக்கப் போகிறது. விற்பனையாளருக்கும், வாடிக்கையாளருக்கும் இடையேயான தொடர்பை இறுக்கிப் பிடித்து விற்பனையை உறுதி செய்வதில் இந்த பெர்சனலைசேஷன் சிந்தனை தேவையானதாய் இருக்கிறது.

ஆகுமென்டட் ரியாலிடி எனும் தொழில்நுட்பத்தில் ஏற்படுகின்ற மாற்றங்களும் தகவல் அறிவியலின் வளர்ச்சியைக் கொண்டு வரும். ஆகுமென்டர் ரியாலிடி இன்றைக்கு ‘கேம்ஸ்’ துறையில் கொண்டு வந்திருக்கின்ற மாற்றங்கள் எக்கச்சக்கம். அப்படியே அந்த நுட்பத்தை ஸ்மார்ட் போனில் மாற்றுகின்ற நடைமுறையும் இப்போது வரத் துவங்கியிருக்கிறது. ஆகுமென்டட் ரியாலிடி வளர வளர, டேட்டா சயின்ஸும் வளரும்.

பிகேவியரல் அனாலிசிஸ் எனப்படும், ஒரு மனிதனுடைய குணாதிசயங்களை அலசுகின்ற, உளவியல் சார்ந்த தகவல் அறிவியலும் இப்போது வளர்ந்து வருகிறது. பயனாளர்களை உளவியல் ரீதியாக அணுகும் முறை இது என்றும் சொல்லலாம். எந்த அளவுக்கு ஒரு நபரைத் தெரிந்து வைத்திருக்கிறோமோ, அந்த அளவுக்கு அவருடைய தேவைகளை அறிந்து கொள்ள முடியும் எனும் அடிப்படை விஷயம் தான் இங்கே கையாளப்படுகிறது.

தகவல் அறிவியலில் வளர்ச்சியும், ஆர்டிபிஷியல் இன்டெலிஜென்ட் வளர்ச்சியும் இயந்திரங்களையும், கருவிகளையும் ஸ்மார்ட் ஆக மாற்றிக் கொண்டிருக்கின்றன. இனிமேல் அந்த கருவிகளெல்லாம் அறிவைத் தாண்டி ஞானம் உடையவையாக மாறும் என்பதே தொழில்நுட்பம் தருகின்ற தொலை நோக்குப் பார்வை. நமது பிள்ளைகளுக்கு நாம் அறிவைக் கொடுக்கும் முன்பே நல்ல சிந்தனைகளையும், பகுத்தறிவையும் கொடுக்கிறோம் இல்லையா ? அதே போல நமது  இயந்திரங்களும் ஞானம் கொண்டவையாய், சுய சிந்தனை கொண்டவையாய் மாறும் என்பதே தகவல் அறிவியலின் சிந்தனை.

சுருக்கமாகச் சொல்லவேண்டுமெனில், தகவல் அறிவியலின் வீச்சும் பயன்பாடும் அடுத்த ஐந்து பத்து ஆண்டுகளுக்கு நிற்கப் போவதில்லை. வடிவம் மாறி, நுட்பம் மாறி பயணித்துக் கொண்டே தான் இருக்கப் போகிறது. எனவே ஆர்வமும், திறமையும் உடையவர்கள் தயங்காமல் இந்தத் துறையை அரவணைத்துக் கொள்ளலாம்

( முற்றும் )

Data Science 7 :

Image result for data science

 

அமெரிக்காவுக்கு மட்டுமே இந்த ஆண்டு இறுதிக்குள் இரண்டு இலட்சம் டேட்டா சயின்ஸ் பொறியாளர்கள் தேவைப்படுவார்கள் என்கிறது மெக்கன்சி ஆய்வு. அடுத்த பத்து ஆண்டுகளுக்கு தொழில் நுட்ப உலகை வசீகரிக்கப் போகும் வேலை இந்த தகவல் அறிவியல் தான் கூகிள் நிறுவன தலைமை பொருளாதார அதிகாரி ஹான் வாரியன். தகவல் அறிவியல் எனும் துறை இப்போதே பெரும்பாலான நிறுவனங்களின் முதுகெலும்பாகத் தான் இருக்கிறது. அப்படி வசீகரிக்கும் நிறுவனங்களில் மூன்று நிறுவனங்களைப் பற்றி நாம் கடைசியில் பார்ப்போம் !

‘இந்த தகவலை எல்லாம் வெச்சு என்ன செய்ய போறோம்” என்கிற மனநிலை ஒரு காலத்தில் இருந்தது. இப்போது அது தலைகீழாக மாறிவிட்டது. எந்த தகவலை வைத்தும் என்ன வேண்டுமானாலும் செய்யலாம் எனும் சிந்தனை உருவாகிவிட்டது. தகவல் என்பது பொன்முட்டையிடும் வாத்தாக மாறிவிட்டது. தகவல் என்பது பணம் காய்க்கும் மரமாகிவிட்டது. அதனால் தான் எல்லா மென்பொருட்களும், நிறுவனங்களும் தகவல் சேகரிப்பில் ஆர்வம் காட்டுகின்றன. அது பல வேளைகளில் தனி மனித சுதந்திரத்துக்கு வேட்டு வைப்பதாகவும் அமைந்து விடுகிறது என்பது தனிக்கதை.

எனவே இப்போதெல்லாம் நிறுவனங்கள் தங்கள் அடிப்படை சிந்தனையாக எழுதிக் கொள்ளும் விஷயம் இது தான், “தகவல்கள் எல்லாமே ஏதோ ஒரு வகையில் தேவையானவை”. ஒரு தகவலை சாதாரணமான ஒரு எண்ணாகவோ, எழுத்தாகவோ பார்க்காமல் அதன் பின்னணியில் இயங்குகின்ற விஷயங்களை ஊகித்து அறிவதிலும், கணித்து கண்டுபிடிப்பதிலும் இருக்கிறது தகவல் அறிவியலின் முதல் வெற்றி.

தகவல்களுக்கு எடை உண்டு ! தகவல்கள் காற்றைப் போல அங்கும் இங்கும் அலைந்து திரிந்தாலும் அதை சரியான வகையில் கட்டுப்படுத்தி கட்டி வைப்பவர்களுக்கு அது செல்வத்தை அள்ளித் தருகிறது. காற்றிலிருந்தும் தகவலை சேகரிப்பது தகவல் அறிவியலின் தேவை. அதாவது, யாருக்கும் தேவையில்லை என நினைக்கும் விஷயங்கள் ஒரு நிறுவனத்தின் வளர்ச்சியையே ஒட்டு மொத்தமாய்ப் புரட்டிப் போட முடியும்.

இப்போது இன்னொரு சிந்தனை வேண்டும். “நம்மிடம் இருக்கின்ற பிரச்சினை இன்னது.. இதை எப்படி நம்மிடம் இருக்கின்ற தகவலோடு இணைத்து முடிச்சுப் போடுவது ? இதற்குத் தான் மென்பொருட்களும், அல்காரிதங்களும் உதவிக்கு வருகின்றன. ஆனால் ஒரு சாதாரண நபராக ஒரு பிரச்சினையையும், அதை எப்படி இந்தத் தகவல் தீர்த்து வைக்கலாம் எனும் சிந்தனையும் இருக்க வேண்டியது அவசியம்.

இப்போது அடுத்த நிலை ! தகவலைப் புரிந்து கொண்டாயிற்று. அதை எப்படி பிரச்சினையோடு இணைத்து முடிவை நோக்கி நகர்வது என்பதையும் அறிந்தாயிற்று. அதைச் செயல்படுத்தக்கூடிய கட்டமைப்பு நிறுவனத்துக்கு இருக்கிறதா ? என்பதைப் பார்க்க வேண்டும். வண்டி நுழையாத தெருவுக்குள் வீட்டை கட்டி வைத்தால், பென்ஸ் கார் வாங்கினாலும் பயனில்லை அல்லவா ? எனவே செயல்படுத்தப் பட வேண்டிய கட்டமைப்பை உருவாக்குவதும், சரியான நேரத்தில் அதை செயல்படுத்துவதும் அவசியம்.

எதிர்காலத்தில் இந்த தகவல் அறிவியல் என்பது , ‘ரியல் டைம் டேட்டா’ அதாவது தகவல்கள் வர வர அதை வைத்து ஆட்டோமெடிக்காக அலசி முடிவுகள் எடுக்கும் முறை வந்து விடும். இப்போதைக்கு இருக்கின்ற தகவல்களைக் குவித்து, அதை அலசி தான் முடிவுகளை எடுக்கிறோம். அதன் பின் வருகின்ற அதிகபடியான தகவல்கள் ஆட்டோமெடிக்காக பயன்படுத்தப்படும் சூழல் உருவாகும்.

இப்போது தகவல் அறிவியல் துறையில் கோலோச்சிக் கொண்டிருக்கும் டாப் 3 நிறுவனங்களைப் பற்றி பார்க்கலாம்.

1. கூகிள் !

நம்மை ரகசியக் கண் கொண்டு பார்த்துக் கொண்டே இருக்கும் நிறுவனம் என நீங்கள் கூகிளை சொல்லலாம். ஜிமெயிலில் நீங்கள் அனுப்புகின்ற ஒவ்வொரு மெயிலும் வாசிக்கப்படலாம், பிக் டேட்டா அனாலிசிஸ் செய்யப்படலாம், அந்தத் தகவல்களை பிஸினஸ் தேவைக்காய் பயன்படுத்தலாம்.

உதாரணமாக, நீங்கள் ஒரு விமான டிக்கெட் புக் செய்கிறீர்கள். அதை கூகிள் மெயிலுக்கு அனுப்புகிறீர்கள் என வைத்துக் கொள்ளுங்கள். அது அந்தத் தகவல்களையெல்லாம் படித்து விட்டு, அங்கே அந்த நாளில் உங்களுக்கு ஹோட்டல் வேண்டுமா, கார் வேண்டுமா, வேறு ஏதாவது வசதிகள் வேண்டுமா என டிஜிடல் நச்சரிப்பை ஆரம்பிக்கும்.

எதற்கெடுத்தாலும் நாம் கூகிளைத் தான் அழைத்து, ‘தேடுதல்’ செய்கிறோம் இல்லையா ? அந்த தகவல்களெல்லாம் அவர்களுடைய சர்வரைக் கடந்து தான் செல்கின்றன. அவற்றில் எவையெல்லாம் தேவைப்படுமோ அவற்றையெல்லாம் கூகிள் சேமித்துக் கொள்கிறது. இன்னும் சொல்லப்போனால், தனது நிறுவனத்தில் பணிசெய்யும் ஊழியர்களுக்கு என்ன கொடுத்தால் குஷியாவார்கள் என்பதையும் இந்த தகவல் அறிவியல் கண்டறிந்து சொல்கிறது.

நீங்கள் யூடியூபில் பார்க்கின்ற வீடியோக்கள் அடிப்படையில் உங்களுக்கு புதிய வீடியோக்களை அறிமுகம் செய்கிறது. அதன்பின் இப்படிப்பட்ட வீடியோ பார்ப்பவர்கள் வேறென்ன பார்க்கலாம் என்பதைக் கணிக்கிறது. எத்தனை முறை பார்க்கிறார்கள் என்பதை வைத்து அவர்களை எடை போடுகிறது. எந்த நேரத்தில் எந்த வீடியோவைப் பார்ப்பவர்கள் என்ன குணாதிசயம் கொண்டவர்கள் என்பதை அல்காரிதம் மூலம் சேமிக்கிறது. அதன் அடிப்படையில் விளம்பரங்களோ, வசீகரங்களோ தந்து வலையில் வீழ்த்துகிறது.

2. அமேசான் !

அமேசான் நிறுவனத்தைப் பற்றி சொல்லவேண்டாம். ஆன்லைன் ஷாப்பிங் செய்த எல்லோருக்குமே அந்த அனுபவம் நிச்சயம் இருக்கும். ஒரு பொருளை வாங்க அந்தத் தளத்துக்குப் போனாலே உங்களை வரவேற்று உங்களுக்குத் தேவையானவற்றைத் தந்து உங்களை ஈர்த்துக் கொண்டே இருக்கும்.

உங்களுடைய தேடுதல் பேட்டர்ன், உங்களுடைய பர்சேஸ் பேட்டர்ன் போன்றவற்றையெல்லாம் வைத்து நீங்கள் ஒரு பொருளை வாங்குவீர்களா, மாட்டீர்களா என்பதை அது கணிக்கும். உங்களுடைய வாங்கும் திறமைக்குத் தக்க பொருட்களை மட்டுமே அது உங்களுக்கு பரிந்துரை செய்யும். மாருதி கார் வாங்கும் அளவுக்கு வசதி மட்டுமே உடையவர்களுக்கு அது ஆடி காரை பரிந்துரை செய்யாது. அந்த அளவுக்கு அதை அறிவுசார் மென்பொருளாய் மாறியிருக்கிறது. அதன் காரணஅது ம் ஆர்டிபிஷியல் இன்டலிஜென்ஸ் கலந்த பிக் டேட்டா என்பதில் சந்தேகமில்லை.

அது இன்னும் ஒரு படி மேலே போய், நீங்கள் ஒரு பொருளை வாங்குவீர்களா இல்லையா என்பதைக் கணித்து, வாங்குவீர்கள் என மென்பொருளின் அல்காரிதம் சொன்னால் அந்தப் பொருளை அடுத்திருக்கும் ஒரு கடைக்கோ, கோடவுனுக்கோ அது அனுப்பவும் செய்கிறது. இப்படி தனது வளர்ச்சியின் முதுகெலும்பாய் தகவல் அறிவியலைத் தான் கட்டி வைத்திருக்கிறது.

3, ஃபேஸ் புக் !

பேஸ்புக் தகவல் அறிவியலில் ஒரு மிகப்பெரிய உயரத்தை எட்டிய கம்பெனி. இந்த நிறுவனத்தின் பாசிடிவ் விஷயம் என்னவென்றால், அவர்களிடம் எக்கச்சக்க தகவல்கள் இருக்கின்றன என்பது தான். ஒன்றிரண்டு அல்ல, அவர்களிடம் சுமார் 220 கோடி பேருடைய தகவல்கள் இருக்கின்றன. எல்லாமே தனிப்பட்ட தகவல்கள். இவற்றை வைத்துக் கொண்டு உங்களுடைய தேவைகளையெல்லாம் அது அறிந்து கொள்ளும்.

அப்படியே உங்களோடு தொடர்பில் இருப்பவர்களைப் பார்த்து, யாரையெல்லாம் வசீகரிக்கலாம். என்னென்ன பொருட்களை விற்கலாம். என்பதையெல்லாம் கணக்கு போடும். விளம்பரங்களின் மூலம் மிகப்பெரிய லாபத்தை அடைகின்ற நிறுவனங்களில் ஒன்று பேஸ்புக் என்பதில் சந்தேகமேயில்லை.

இவையெல்லாம் நமக்குத் தெரிந்த பெரிய கம்பெனிகள். அதற்காக அவை மட்டும் தான் இந்த தகவல் அறிவியல் துறையில் கோலோச்சும் நிறுவனங்கள் என்பதில்லை. சின்னச் சின்ன நிறுவனங்கள் கூட தகவல் அறிவியலை தங்களுடைய பிஸினஸ் வளர்ச்சிக்குப் பயன்படுத்துகின்றன.

“சரி பண்றவன் பண்ணிட்டு போறான்”, என நிறுவனங்கள் அலட்சியமாய் இருந்து விடவும் முடியாது. பொம்மலாட்டக் குதிரையை ரேஸ் டிராக்கில் விட்டது போல ஆபத்தாகிவிடும். விரைவிலேயே பிஸினஸை மூட்டை கட்டி வைப்பதைத் தவிர வேறு வழி இல்லை என்றாகிவிடும்.

தகவல் அறிவியலின் சிந்தனை கொஞ்சம் பழையதாய் இருந்தாலும், இன்றைய தொழில்நுட்பம் அதை மிகப்பெரிய உயரத்துக்கு எடுத்துச் சென்றிருக்கிறது. அதனால் தான் இன்றைக்கு தகவல் அறிவியல் பொறியாளர்களின் தேவை முன்பெப்போதும் இல்லாத அளவுக்கு எகிறியிருக்கிறது.

Data Science 6 : தகவல் அறிவியல் 6

Image result for data science

தகவல் அறிவியல் என்றால் என்ன ? அதற்கு என்னென்ன அடிப்படைத் திறமைகள் இருக்க வேண்டும் ? யாரெல்லாம் தகவல் அறிவியல் துறையில் நுழையலாம். இதனால் தொழில்நுட்ப உலகில் நிகழ்கின்ற மாற்றங்கள் என்னென்ன ? எப்படிப்பட்ட வேலைகள் நமக்காகக் காத்திருக்கின்றன, போன்றவற்றையெல்லாம் கடந்த வாரங்களில் நாம் அலசினோம். இந்த வாரம் தகவல் அறிவியல் துறையில் கோலோச்சுகின்ற சில மென்பொருட்களைப் பற்றிப் பார்க்கலாம் !

தொழில்நுட்பத் துறையில் நுழைபவர்கள் முன்னால் எப்போதுமே ஆஜானுபாகுவாய் நிற்கும் ஒரு மிகப்பெரிய கேள்வி, “என்ன படிக்கலாம் ?” என்பது தான். பட்டப்டிப்பைப் பொறுத்தவரை எளிதில் நாம் ஒரு முடிவுக்கு வந்து விடலாம். அல்லது ஒரு நாலு பேரிடம் கேட்டால் ஒரு பொதுவான பதில் கிடைத்து விடும். அதை வைத்துக் கொண்டு நாம் ஒரு படிப்பைத் தேர்ந்தெடுக்கலாம்.

ஆனால் மென்பொருள் விஷயத்தில் அப்படி நடக்காது. நாலு பேர் என்ன ? நாற்பது பேரிடம் கேட்டால் நாற்பது விதமாகத் தான் சொல்லுவார்கள். அதில் எது சரியானது என்பதைக் கண்டுபிடிப்பது இடியாப்பச் சிக்கல் போன்றது. அதற்காக, உங்களுக்கு ஐடியா கொடுப்பவர்களைக் குறைசொல்கிறேன் என்பது பொருள் அல்ல ! ஒவ்வொருவரும் அவரவர் பார்வையில் எது தேவையானது என்பதைச் சொல்வார்கள் அவ்வளவு தான்.

எனவே பொதுவாக எவையெல்லாம் முக்கியமான மென்பொருட்கள் என்பதை அறிந்து கொள்வது தேவையான ஒன்று ! ஒன்றை நினைவில் வைத்துக் கொள்ளுங்கள். தகவல் அறிவியல் துறையில் நூற்றுக்கணக்கான மென்பொருட்கள் உள்ளன ! அனைத்தையும் படித்து அதில் எக்ஸ்பர்ட் ஆவது என்பது சாத்தியமில்லாத ஒன்று ! மட்டுமல்ல, தேவையில்லாத ஒன்றும் கூட ! எனவே சிலவற்றைத் தேர்ந்தெடுத்து அதை ஆழமாகப் படிப்பது மட்டுமே தேவையானது !

இந்தத் துறையில் முக்கியமாய் கோலோச்சுகின்ற மென்பொருட்கள் என்னென்ன என்பதை, தொழில்நுட்ப அடிப்படையிலும், பயன்பாட்டு அடிப்படையிலும், தேவையின் அடிபடையிலும் பார்ப்போம்.

ஒரு டாப் 10 மென்பொருட்கள் என தேர்ந்தெடுப்பது “டாப் 10 மூவீஸ்” போல அத்தனை எளிதல்ல. இருந்தாலும் இவை நிச்சயம் சிறப்பிடம் பிடிக்கக் கூடிய மென்பொருட்கள் என்பதில் சந்தேகமில்லை.

1. ஆர்

தகவல் அறிவியல் துறையில் எல்லோரும் கேள்விப்பட்டிருக்கக் கூடிய ஒரு மென்பொருள் ஆர் ! ஒரே ஒரு எழுத்துடைய மென்பொருள் என்பதால் மனதில் எளிதாய் தங்கும் ! ஸ்டாட்டிஸ்டிகல் கம்ப்யூட்டிங் எனப்படும் புள்ளிவிவரக் கணினியியலில் இந்த மென்பொருளின் பங்களிப்பு கணிசமானது.

வின்டோஸ், மேக், யுனிக்ஸ், லெனக்ஸ் என பல்வேறு தளங்களில் இது பயன்படுத்த முடியும் எனும் நிலையில் உள்ளது. சாஸ் போன்ற பிரபல மென்பொருட்களுக்கு மிகச்சிறந்த மாற்றாக தொழில்நுட்ப உலகில் கோலோச்சும் மென்பொருள்.

2. மேட்பிளாட்லிப்

தகவல்களை எப்படி வசீகரமாக, எளிதாகப் புரியும் வகையில் சொல்லலாம் என்பது மிக முக்கியம். அதற்கு மேட்பிளாட்லிப் ரொம்பவே கைகொடுக்கும். ஸ்டாட்டிஸ்டிக் அதாவது புள்ளி விவரங்களை வரைபடங்களாக மாற்றி வசீகரிக்க வைப்பதில் இது முக்கியத்துவம் பெறுகிறது.

மேட்லேப் போன்ற மென்பொருட்களின் மீது பரிச்சயம் உண்டென்றால் மேட்பிளாட்லிப்பைக் கற்றுக் கொள்வது, மிக எளிதான விஷயம். அல்லது அதே போன்ற வேறெந்த மென்பொருளைக் கற்றிருந்தாலும் இதை எளிதில் புரிந்து கொள்ளலாம்.

3. ரேப்பிட் மைனர்

இலவசமாகக் கிடைக்கின்ற ஓப்பன் சோர்ஸ் மென்பொருள் இது. தகவல் அறிவியலில் முடிவுகளை எடுப்பதற்கு இந்த மென்பொருள் உதவும். இதற்குள் மெஷின் லேர்னிங் அல்காரிதம்கள் இதற்குள் ஏற்கனவே தயாராய் இருக்கும். ஒருவகையில் கொஞ்சம் ரெடிமேட் மென்பொருள் இது.

ஏகப்பட்ட பைல் வகைகளை இது ஏற்றுக் கொள்ளும், முப்பதுக்கும் மேற்பட்ட வகையில் முடிவுகளை வெளிப்படுத்தும், என பல்வேறு வசீகர அம்சங்கள்

4. ஹடூப்

பிக் டேட்டா எனும் பெயர் கடந்த சில ஆண்டுகளாக தொழில்நுட்ப உலகை கலக்கிக் கொண்டிருந்தபோது பிரபலமானது இந்த ஹடூப். ஆறு ஆண்டுகளுக்கு முன்பே வெளியானாலும் கடந்த மூன்று நான்கு ஆண்டுகளாய் தான் பிரபலமானது.

தகவல் அறிவியலில் பிக்டேட்டாவின் பங்களிப்பும் அடக்கம். தகவல் அறிவியலின் ஒரு பாகம் தான் பிக்டேட்டா என்றும் சொல்லலாம். எனவே ஹடூப் தெரிந்திருப்பது டேட்டா சயின்ஸ் துறைக்கு ரொம்பவே பயன் தரும். அப்பாச்சி ஹடூப் பிரேம்வர்க் பற்றி நன்றாகப் புரிந்து கொள்வது பயனளிக்கும்.

5. டேப்லூ பப்ளிக்

டேட்டா விசுவலைசேஷன் எனப்படும் தகவலை கற்பனையில் விரித்துப் பார்ப்பது தகவல் அறிவியலில் மிக முக்கியமானது. அதற்கு பல்வேறு மென்பொருட்கள் உதவுகின்றன. அதில் முக்கியமான ஒரு மென்பொருள் இது.

மென்பொருள் துறையில் பரிச்சயம் இல்லாதவர்களும் இதை மிக எளிதில் கற்றுக் கொண்டு பயன்படுத்தலாம் என்பது இதிலுள்ள ஒரு சிறப்பம்சம். இதிலுள்ள ஒரு குறை என்னவென்றால், இதையும் மென்பொருள் ‘ஆர்” ஐயும் இணைக்க முடியாது என்பது தான். இரண்டுமே பிரபலமான மென்பொருட்கள் ! இரண்டையும் இணைக்கும் வகை இருந்திருந்தால் இன்னும் சிறப்பாக இருந்திருக்கும்.

6. ஓப்பன் ரிஃபைன்

தகவல் அறிவியலில் தேவைப்படும் ஒரு முக்கியமான விஷயம், தகவல்களை தூசு தட்டி சுத்தம் செய்வது. அதற்கும் பல மென்பொருட்கள் இருக்கின்றன. அதில் முக்கியமான ஒன்று ஓப்பன் ரிஃபைன். கூகிள் ரிஃபைன் என முன்பு அழைக்கப்பட்டு வந்த மென்பொருளும் இது தான்.

தகவலை தூய்மைப்படுத்துவது, தேவையற்றவற்றை நீக்குவது,ஒன்றிலிருந்து இன்னொரு வகைக்கு தகவலை மாற்றுவது,தகவலை உடைத்து சின்னச் சின்ன தகவல்கள் ஆக்குவது என பல்வேறு பணிகளை இந்த மென்பொருள் செய்யும்.

7. KNIME

பயன்படுத்துவதற்கு மிக எளிமையான ஒரு மென்பொருள். இங்கிலாந்தில் பல நிறுவனங்கள் இந்த மென்பொருளை பயன்படுத்துகின்றன. பல மென்பொருட்களை இத்துடன் இணைத்து பணிபுரியலாம் என்பது இதிலுள்ள ஒரு பிளஸ். வேதியில் தகவல்களையும் இந்த மென்பொருளில் பயன்படுத்தலாம் என்பது இதிலுள்ள இன்னொரு சிறப்பம்சம்.

தகவல்களை அலசுவதற்கும், பிற பல தகவல்களோடு இணைப்பதற்கும் இந்த மென்பொருள் பயன்படும்.

8. நோட் எக்ஸ் எல்.

சமூக வலைத்தளங்களிலுள்ள தகவல்கள் டேட்டா சயின்ஸ் துறையில் முக்கிய பங்கு ஆற்றுகின்றன என்பது நமக்குத் தெரியும். இந்த மென்பொருள் அதில் சிறப்பிடம் பெறுகிறது. நெட்வர்க், சமூக வலைத்தளம், மென்பொருள் எல்லாவற்றையும் இணைக்கும் பாலமாக இந்த மென்பொருள் உதவும்.

தகவலை உள்ளீடு செய்வதற்கு, அதை படங்களாக காட்சிப்படுத்துவதற்கு, படங்களை அலசி ஆராய்வதற்கு, தகவல்களை அறிக்கைகளாக மாற்றுவதற்கு என பல விஷயங்களுக்கு இது பயன்படும். எக்ஸெஸ் மென்பொருளை மையமாக வைத்து இது இயங்குகிறது என்பது இதன் பயன்பாட்டு எல்லையை அதிகரித்திருக்கிறது எனலாம்.

9. Paxata

இன்னொரு பிரபலமான தகவல்களை சரிசெய்யும் மென்பொருள். மென்பொருள் துறையில் பரிச்சயம் இல்லாதவர்களும் இதை எளிதில் பயன்படுத்தலாம் என்பது இதன் முக்கியமான அம்சம். தகவல்களை வரைபடங்களாக மாற்றி அதிலுள்ள குறைகளை எளிதில் சுட்டிக்காட்டும். தேவையான மாற்றங்களைச் செய்து கொள்ள அது அனுமதிக்கும். பின் அந்த தகவல்களை வேறு வடிவில் மாற்றுவதற்கும் கைகொடுக்கும்.

தகவல்களை எந்த வடிவத்தில் பார்க்க விரும்புகிறீர்களோ அப்படிப் பார்க்க இதில் பல வசதிகள் உண்டு. பல தகவல் கூட்டங்களை இணைத்து புதிய தகவல் வகையை உருவாக்கவும் இதில் வசதிகள் உண்டு. ஸ்மார்ட் ஃபூஷன் எனப்படும் இதற்கான சிறப்பு மென்பொருள் வசதி இதில் மட்டுமே உண்டு.

10 நரேட்டிவ் சயின்ஸ்

இதிலுள்ள சிறப்பம்சம் தகவல்களை உள்ளீடு செய்தால் தானாகவே அறிக்கைகளை தயாராக்கும் என்பது தான். தகவல்களை வாசித்துப் பார்த்து எத்தகைய அறிக்கையை உருவாக்கலாம் என்பதை முடிவு செய்து அதுவாகவே உருவாக்கும்.

இதில் ஆர்டிபிஷியல் இன்டெலிஜென்ஸ் தொழில்நுட்பம் உண்டு. அது தான் தகவல்களை பயன்பாட்டாளருக்குத் தேவையான வகையில் ஆட்டோமேட்டிக்காகவே உருவாக்கித் தரும். ரொம்ப கஷ்டம் இல்லாமலேயே டேட்டா சயின்டிஸ்ட்களுக்கு தேவையான தகவல்களை இது தரும் !

Data Science 5 : தகவல் அறிவியல் 5

Image result for data science

கடந்த வாரங்களில் தகவல் அறிவியல் என்றால் என்ன என்பதைப் பற்றியும், அதன் பயன்கள் பற்றியும், அந்தத் துறையில் உள்ள பல்வேறு வேலை வாய்ப்பு விஷயங்கள் பற்றியும் பார்த்தோம். இந்த வாரம் தகவல் அறிவியல் துறைக்குள் நுழைந்து அங்கே அப்படி என்ன தான் வேலை செய்கிறார்கள் என்பதை எட்டிப் பார்க்கப் போகிறோம் !

அப்படி தகவல் அறிவியல் துறையில் என்ன வேலை தான் செய்கிறார்கள் ?

1. பிரச்சினையை புரிதல் !

தகவல் அறிவியலின் ஆகப் பெரிய விஷயமே ஒரு நிறுவனத்தின் பிரச்சினை என்ன என்பதைப் புரிந்து கொள்வது. பிரச்சினை என்ன என்பதைப் புரிந்து கொள்வது என்பது இரண்டு நிலை கொண்டது. ஒன்று ‘இது தான் என்னோட பிரச்சினை’ என முன்வைப்பது. இரண்டாவது, ‘இந்த பிரச்சினை இல்லாமல் எனக்கு இப்படிப்பட்ட ஒரு நிலை வேண்டும்’ என்பது !

ஒரு பிரச்சினையை அக்கு வேறு ஆணி வேறாகப் புரிந்து கொள்வது தகவல் அறிவியலில் மிக முக்கியம். அதற்கு ஏகப்பட்ட கேள்விகளைக் கேட்க வேண்டும். கேள்விகள் பிரச்சினைகளை அதிகப்படுத்தி, அதிலுள்ள அடிப்பட்ட விஷயங்கள் வரை வெளிக்கொணரும். எந்த அளவுக்கு பிரச்சினையை பிரச்சினையைப் புரிந்து கொள்கிறோமோ, அந்த அளவுக்கு தெளிவான தீர்வுகள் கிடைக்கும். பிரச்சினையைப் புரிந்து கொள்ளாமல் களத்தில் இறங்குவது தவகல் அறிவியல் துறையைப் பொறுத்தவரை மிகப்பெரிய பிழை.

உதாரணமாக, “நிறைய கஸ்டமர்களை ஈர்க்க வேண்டும்” என்பது ஒரு வரி தேவையாக இருக்கலாம். அதை வைத்துக் கொண்டு தகவல் அறிவியலில் எதுவும் செய்ய முடியாது. நீங்கள் என்ன செய்கிறீர்கள், எப்படிப்பட்ட கஸ்டமர்கள் வேண்டும், யாரெல்லாம் போட்டியாளர்கள்,அவர்களிடம் எவ்வளவு கஸ்டம்ர்கள் இருக்கிறார்கள், உங்கள் கஸ்டமர்களின் விமர்சனங்கள் என்ன ? குறைகள் என்ன ? எவ்வளவு நாட்கள் சராசரியாக உங்களோடு இருக்கிறார்கள் என தொடங்கி நூற்றுக்கணக்கான கேள்விகளை வரிசையாக எழுப்பினால் உங்களுக்கு கொஞ்சம் கொஞ்சமாக விஷயம் புரியத் துவங்கும்.

எந்த அளவுக்கு கேள்விகளைக் கேட்கிறீர்கள், எந்த அளவுக்கு தொடர்புடைய கேள்விகளைக் கேட்கிறீர்கள் என்பதை வைத்து உங்களுடைய முடிவுகளுக்கு தெளிவு கிடைக்கும். சில கேள்விகள் தான் மாற்றங்களைக் கொண்டு வரும். நிறுவனமே யோசிக்காத விஷயங்களை யோசிக்கத் துவங்குவதும் அப்போது தான். பிரச்சினையை புரிந்து கொள்வதற்கான ‘பிரெயின் ஸ்டாமிங்’ என இந்த விவாதத்தை அழைப்பதுண்டு.

2. தகவல் சேகரிப்பு

பெயரைக் கேட்டாலே புரிஞ்சிருக்குமே ! இருக்கின்ற தகவல்களையெல்லாம் சேகரிப்பது தான் இந்தக் கட்டம். ஆனால் அது நாம் நினைப்பது போல எளிதல்ல. தகவல்கள் எப்போதும் ஒரு நாலு ஃபைல்களில் இருப்பதில்லை. தகவல்கள் எங்கே இருக்கின்றன என்பதைக் கண்டுபிடிக்கவே நிறைய தகவல்கள் தேவைப்படும். அந்த தகவல்களைக் கண்டுபிடித்தபின் அதைச் சேகரிக்க வேண்டும்.

முதலில் வகைப்படுத்தப்பட்ட தகவல்கள் என்னென்ன இருக்கின்றன என்பதைக் கண்டுபிடித்து அவற்றை சேகரிக்க வேண்டும். இது எளிதான பணி. அதிக பயனளிக்கக் கூடிய தகவலும் இது தான். ஆனால் இது மட்டுமே முழுமையான தகவல் அல்ல. உதாரணமாக அலுவலக டேட்டாபேஸை எடுத்து அதிலுள்ள தகவல்களை இழுத்தெடுப்பது ! நிறைய பயனுள்ள தகவல்கள் கிடைக்கும்.

பின்பு நிறுவனம் சார்ந்த மற்ற இடங்களில் இருக்கின்ற தகவல்களை சேகரிக்க வேண்டும். உதாரணமாக அது ஒரு வலைத்தளமாக இருக்கலாம். நிறுவனத்தின் இன்ட்ரா நெட் எனப்படும் பாதுகாப்பான தனி வலைத்தளமாக இருக்கலாம். அவற்றையெல்லாம் சேகரிப்பது கொஞ்சம் கஷ்டமான பணி.

அடுத்தது அலுவலகத்திலுள்ள தகவல்களில் வகைப்படுத்தப்படாத தகவல்களைச் சேகரிப்பது. தலைவலியான வேலை என இதைச் சொல்லலாம். வகைப்படுத்தாத தகவல் எப்படி வேண்டுமானாலும் இருக்கலாம். ஒரு வீடியோவாகவோ, ஆடியோவாகவோ, ஒரு கிறுக்கல் கையெழுத்தாகவோ, ஒரு வாய்ச்சொல்லாகவோ எப்படி வேண்டுமானாலும் இருக்கலாம். அவையும் சேகரிக்கப்பட வேண்டும். அப்போது தான் முழுமையான ஒரு தீர்வுக்குள் செல்ல முடியும்.

தகவல்களைச் சேகரிக்கும் போது, முதல் கட்டத்தில் நாம் ஏகப்பட்ட கேள்விகளைக் கேட்டோமல்லவா ? அந்த அத்தனை கேள்விகளுக்குமான விடைகள் வந்திருக்கின்றனவா என்பதை பரிசீலனை செய்ய வேண்டும். புதிதாக கேள்விகள் கேட்க வேண்டிய தேவையிருந்தால் கேட்கலாம். இந்த கட்டம் மிக முக்கியமான கட்டம். இதில் தவற விடுகின்ற முக்கியமான தகவல்கள் நிறுவனத்தின் முடிவுகளை பெரிய அளவில் பாதிக்க வாய்ப்பு உண்டு.

3. தகவல் செயல்முறை

தகவல் அறிவியலின் முதுகெலும்பு என்பது தகவல் செயல்முறை அதாவது டேட்டா புராசசிங். பிரச்சினையைப் புரிந்து கொள்வதும், தகவல்களை சேகரிப்பதும் எந்த அளவுக்கு சிறப்பாக நடந்திருக்கிறது என்பதை வைத்து தான் இந்த செயல்முறைப் பகுதி வெற்றியடையுமா தோல்வியடையுமா என்பதைச் சொல்ல முடியும்.

தகவல் செயல்முறைக்கு முன்பு இருக்கின்ற ஒரு வேலை தகவல்களை தூசு தட்டி துடைத்து எடுப்பதும். தேவையற்ற தகவல்களை உடைத்து எறிவதும் தான். அந்த வேலைக்காகத் தான் பெரும்பாலான நேரத்தை தகவல் அறிவியலார்கள் செலவிடுவார்கள். சுமார் 70 முதல் 80 சதவீதம் நேரம் தேவையற்ற தகவல்களை நீக்குவதில் செலவாகும் என்கிறது ஒரு ஆய்வு.

தேவையற்ற ஒரு தகவல், முடிவில் மிகப்பெரிய மாற்றத்தை உருவாக்கி விடக்கூடும். எனவே தான் தேவையற்ற தகவல்களை அகற்ற வேண்டியது அவசியாகிறது. எல்லா பாடத்துக்கும் தோற்றுப் போகும் ஒரு மாணவனுக்கு, கணிதத்தில் 400 மதிப்பெண் என தவறாகப் பதிவாகியிருந்தால் மொத்த சதவீதத்தில் அவன் பெயர் முன்னணியில் வருமில்லையா ? அதே போல நினைத்துக் கொள்ளுங்கள்.

இந்த இடத்தில் மென்பொருட்கள் உதவிக்கு வரும். இருக்கின்ற தகவல்களை நாம் அப்படியே எதுவும் செய்து விட முடியாது. அதை அலச, அதை வைத்து உருப்படியாய் ஏதாவது செய்ய கணினியின் உதவி மிக மிக அவசியம். பைத்தான் , ஆர் போன்ற மென்பொருட்கள் இந்த இடத்தில் மிகப்பெரிய உதவியாய் இருக்கும்.

4. தகவல் ஆராய்ச்சி

இப்போது கைவசம் இருப்பவை நல்ல தகவல்கள். முறைப்படுத்தப்பட்ட தகவல்கள். இவற்றை வைத்துக் கொண்டு எப்படியெல்லாம் வித்தை காட்டலாம் என்பது தான் தகவல் அறிவியலின் ஒட்டு மொத்த விஷயம்.

இந்த தகவல்களை அலசி, ஆராய்ந்து, தொடர்புகளைக் கண்டறிந்து அதன்’பேட்டர்ன்’ அதாவது முறைகளை அறிந்து, அதைக் கொண்டு நிறுவனத்துக்குத் தேவையான தீர்வுகளை உருவாக்கும் இடம் இது தான்.

இங்கே எப்படி தகவலை நாம் காட்சிப்படுத்திப் பார்க்கிறோம், மனதுக்குள் படமாக விரித்துப் பார்க்கிறோம் என்பது மிக முக்கியம். அது தான் நிறுவனத்திற்குத் தேவையான தீர்வுகளை நோக்கி வழிநடத்தும்.

இந்த அலசலில் கிடைக்கின்ற தகவல்களை, பேட்டர்ன்களை வைத்து தான் ஆழமான அலசல் செய்ய முடியும். ஆழமன அலசலுக்குள் நுழைவதற்கு முன் தகவல்களை எப்படியெல்லாம் பயன்படுத்தலாம் என்பது குறித்த ஒரு பார்வை இருக்க வேண்டும். இந்த கட்டம் அதைத் தான் தரும்.

5. ஆழமான அலசல்

இந்த கட்டத்தில் தான் கண்டறிந்த தகவல்களை வைத்துக் கொண்டு நிறுவனம் எதிர்பார்க்கின்ற மாடலை உருவாக்கும் வேலை நடைபெறும். இந்த தகவல்களை எப்படிப் பயன்படுத்தினால் எப்படிப்பட்ட பயன்கள் கிடைக்கும் என்பதைக் கணிக்கும் ‘பிரடிக்டிவ் மாடல்’ உருவாவது இப்போது தான்.

இந்த இடத்தில் மீண்டும் சில கேள்விகளை எழுப்ப வேண்டும் ! நான் என்ன மாடலை கணிக்கப் போகிறேன். எனது நோக்கம் என்ன ? அது தான் நிறுவனம் எதிர்பார்க்கின்ற விஷயமா ? நிறுவனத்தின் நோக்கத்தோடும், எதிர்பார்ப்போடும் நான் ஒத்துப் போகிறேனா ? என்பதையெல்லாம் கேள்விகள் மூலம் உறுதி செய்து கொள்ள வேண்டியது முக்கியம்.

ஒரு மாடலை மட்டும் உருவாக்கி நிறுவனத்துக்கு அளிப்பது சரியான முறையல்ல. அது முழுமையான, சரியான, பக்காவான ஒரு தீர்வைத் தருமென்பதில்லை. எனவே பல மாடல்களை உருவாக்கி அதில் எது சிறந்ததாக இருக்கிறதோ, அதைப் பயன்படுத்துவதே சரியான வழி.

அல்காரிதங்கள், மெஷின் லேர்னிங் கான்செப்ட் போன்றவற்றையெல்லாம் பயன்படுத்தும் சரியான இடம் இது தான்.

எவ்வளவு தெளிவான, அழகான மாடலிஅ உருவாக்குகிறோம் என்பதல்ல முக்கியம். அந்த மாடல் நமக்குத் தேவையான ஒரு தீர்வைத் தருமா என்பதே கேள்வி. அதற்குத் தேவையான முயற்சிகளை எடுப்பதே இங்கே முக்கியமான விஷயம்.

5. அறிக்கை தயாரித்தல்

ரிப்போர்ட் ஜெனரேஷன் என்பது எந்த ஒரு பணியிலும் கிட்டத்தட்ட கடைசியில் வருகின்ற ஒரு வேலை. அது தான் அந்த ஒட்டு மொத்தப் பணிக்கும் ஒரு மரியாதையைக் கொண்டு வரும். ராப்பகலா கண்ணு முழிச்சு படிச்சேன், ஆனா பரீட்சைக்கு எதுவும் எழுதல என்றால் எப்படி இருக்கும். அதே போல தான், என்ன தான் முழு உழைப்பையும் போட்டு மாடல் உருவாக்கினாலும், அதை சரியான முறையில் காட்டவில்லையேல் பயனில்லை.

இந்த ஏரியாவை பலரும் அலட்சியமாக நினைப்பதுண்டு. ஆனால் இது மிக முக்கியமான ஒரு கட்டம் என்பதைப் புரிந்து கொள்ள வேண்டும்.

பார்த்தவுடன் பளிச் என புரிகின்ற படங்கள் மூலமாகவோ, புள்ளி விவரங்கள் மூலமாகவோ, இதை எளிமையாக விளக்குவது பயனளிக்கும். டைனமிக் ரிப்போர்ட்டிங் எனப்படும் தகவல்களை மாற்றுவதற்கு ஏற்ப மாறுகின்ற ஆன்லைன் ரிப்போர்டிங் இங்கே ரொம்ப வலிமையானது.

இவை தான் தகவல் அறிவியல் வேலையில் நடக்கின்ற பணிகள்.

( தொடர்வோம் )

தகவல் அறிவியல் – 4

Image result for data science

தகவல் அறிவியல் துறையில் வேலை வாய்ப்புகள் அதிகமாய் இருக்கிறது என்பதையும்,  கணிதம், பட்டப்படிப்பு, மென்பொருள் போன்றவற்றைப் படித்தவர்களுக்கு அங்கே வேலை வாய்ப்புகளும் அதிகமாய் இருக்கின்றன என்பதையும் கடந்த வாரம் அலசினோம். அப்படி இந்த துறையில் எப்படிப்பட்ட வேலைகள் இருக்கின்றன என்பதைப் பற்றிய ஒரு அறிமுகத்தைப் பார்போம்.

தகவல் அறிவியல் துறையில் பல்வேறு வேலைகள் இருக்கின்றன. நிறுவனத்தின் தேவைக்கும் தன்மைக்கும் ஏற்ப அவர்கள் அவற்றுக்கு பெயரிட்டு அழைப்பதும் உண்டு. உதாரணமாக சில நிறுவனங்கள் தகவல் விஞ்ஞானத்தை, மெஷின் லேர்னிங் என்றும் அழைப்பதுண்டு. பொதுவாக எப்படிப்பட்ட வேலைகள் இந்த துறையில் உண்டு என்பதை பார்ப்போம்.

மேஜேஜ்மென்ட் இன்ஃபர்மேஷன் சிஸ்டம்ஸ் ரிப்போர்டிங் எக்சிகியூட்டிவ் ( MIS Reporting Executive ) என ஒரு பணி இருக்கிறது. தகவல் அறிவியலைப் பொறுத்தவரை இது ஒரு மிக முக்கியமான பணி. வணிகத் தேவை என்ன என்பதை சரியாகப் புரிவதும், தொழில்நுட்பத்தில் அதை எப்படி புகுத்துவது என்பதையும் இவர்கள் தான் முடிவு செய்வார்கள். அதாவது இவர்கள் கொடுக்கின்ற அறிக்கைகளின் அடிப்படையில் தான் பெரும்பாலான பிசினஸ் முடிவுகள் எடுக்கப்படும்.

இவர்களுடைய பணி, நிறுவனத்துக்குத் தேவையான அறிக்கைகளை பல்வேறு வகைகளில் உருவாக்குவது. நூற்றுக்கணக்கான பக்கங்களில் எழுதி வைக்கவேண்டிய தகவல்களை ஒரு சின்ன படத்தின் மூலம் காட்டி விடும் வித்தை இவர்களின் சிந்தனைக்கு உரியது.

உதாரணமாக, விற்பனைத் தகவல்கள் என்னென்ன ? என்னென்ன பொருட்கள் கைவசம் இருக்கின்றன ? எப்படிப்பட்ட விமர்சனங்கள் வந்திருக்கின்றன ? போன்ற  பல்வேறு தகவல்களை இவர்கள் அலசுவார்கள். அதன் அடிப்படையில் அவர்கள் உருவாக்கும் அறிக்கைகள் முக்கியமான தொழில் முடிவுகள் எடுக்க வசதியாக இருக்கும்.

கணினி துறை அல்லது பொறியியலில் பட்டப்படிப்பு இருப்பவர்கள் இந்தத் துறையில் நுழைவது அவர்களுக்கு எளிதாக இருக்கும். “எப்படிப்பட்ட தகவல்களைக் கொடுத்தால் பிஸினஸ் வளரும்” என்கின்ற ஒரு பரந்து பட்ட பார்வை இருக்க வேண்டியது அவசியம். காரணம், இவர்கள் கொடுக்கின்ற தகவல்களே பிஸினஸை அடுத்த நிலைக்கு கொண்டு செல்லவும், எப்படிப்பட்ட திசையில் பயணிக்க வேண்டும் என்பதை முடிவு செய்யவும், எப்படிப்பட்ட மாற்றங்களைக் கொண்டு வரவேண்டும் என்பதைத் தீர்மானிக்கவும் உதவுகின்றன.

பிஸினஸ் அனலிஸ்ட் ; இன்னொரு முக்கியமான பணி. இதை வணிக ஆய்வாளர் பணி என்று சொல்லலாமா ? அல்லது தொழில் ஆய்வாளர் என்று சொல்லலாமா தெரியவில்லை. இப்போதைக்கு பிசினஸ் அனலிஸ்ட் என்றே வைத்துக் கொள்வோம்.

ஒரு நிறுவனத்தின் தேவையை துவக்கத்திலிருந்தே கவனிப்பது இவர்களுடைய வேலை. ஒரு பிஸினஸ் வளர்ச்சியடைய என்னென்ன தடைகள் இருக்கின்றன. என்னென்ன இடைவெளிகள் இருக்கின்றன என்பதைக் கண்டறிவது இவர்களுடைய வேலையின் முக்கியமான அம்சம்.

தகவல்களை அலசி ஆராய்பவர்களைத் தகவல் ஆய்வாளர் என்று சொல்வோம். அதே போல பிஸினஸை அலசி ஆராய்பவர்களே இந்த பிஸினஸ் அனலிஸ்ட் என அழைக்கப்படுகின்றனர்.

பிஸினஸ் அட்மினிஸ்ட்ரேஷன் (எம்.பி.ஏ) பிரிவில் ஒரு பட்டப்படிப்பு இருப்பது இந்த வேலைக்கு ரொம்ப நல்லது. கூடவே தகவல்களோடு விளையாடும் ஆர்வம் இருக்க வேண்டும். பிஸினஸை எப்படியெல்லாம் வலுப்படுத்தலாம் எனும் பார்வை இருக்க வேண்டியதும் அவசியம்.

பிஸினஸின் தேவையை சரிவரப் புரிந்து அதிலுள்ள குறைகளைக் களைந்து தொழில்நுட்பத்தின் மூலம் அதை வலுப்படுத்தும் பணியே இந்த பிஸினஸ் அனலிஸ்ட் பணி.

டேட்டா அனலிஸ்ட்

தகவல் அறிவியலில் மிக முக்கியமான பணிகளில் ஒன்று டேட்டா அனலிஸ்ட் வேலை. தகவல்களைத் திரட்டுவது, திரட்டிய தகவல்களை வகைப்படுத்துவது இரண்டும் இவர்களுடைய கைவேலைகள். இவர்களும் டேட்டா விஞ்ஞானிகள் அதாவது டேட்டா சயின்டிஸ்ட் இருவரும் வேறு வேறு.

டேட்டா அனலிஸ்ட் என்பவர் அவருக்கு ரொம்ப ஜூனியர் என்று வேண்டுமானால் வைத்துக் கொள்ளலாம். ஆனால் மிக முக்கியமான அடிப்படைப் பணிகள் செய்வது இவர்கள் தான்.

டேட்டா அனலிஸ்ட் என்பவர் ஒரு சில முக்கியமான மென்பொருட்களைப் பற்றித் தெரிந்திருக்க வேண்டும். குறிப்பாக ஆர், பைத்தான், எச்.டி.எம்.எல், எஸ்.க்யூ.எல், சி ++, ஜாவா போன்ற அனைத்து மென்பொருட்களின் கலவையாய் உங்களுடைய மென்பொருள் பரிச்சயம் இருப்பது மிக சிறப்பு.

தகவல்களை சேர்ப்பது, சேமிப்பது இவற்றோடு இவர்களுடைய பணி முடிந்து விடுவதில்லை. எப்படி அதை பயன்படுத்துவது என்பதையும் இவர்கள் யோசிக்க வேண்டும். ஹடூப் போன்ற மென்பொருட்களைக் கற்பது பயன்கொடுக்கும்.

நிறுவனத்தின் பல்வேறு நிலைகளிலுமுள்ள தலைவர்கள், வெவ்வேறு தகவல் தேவைகளோடு அணுகுவது இவர்களைத் தான். இவர்களும் அவர்களுடைய தேவைகளை நிறைவேற்றும் வகையில் தங்களுடைய மூளையையும், கையிலுள்ள தகவலையும் கசக்குவார்கள்.

எப்படி தகவலை வகைப்படுத்துவது, அதை எப்படி பயனுள்ள வகையில் மாற்றுவது, அல்காரிதங்களை/வழிமுறைகளை எழுதுவது, என்பதையெல்லாம் கவனிப்பது இவர்கள் தான்.

  1. ஸ்டாட்டிஸ்டிஷியன் / புள்ளிவிவர ஆய்வாளர்

ஸ்டாட்டிஸ்டிக் விஷயங்களைச் சொல்லும் இவரைப் புள்ளி விவரப் புலி என்று சொல்லலாமா ? தகவல்களைச் சேர்த்து, வகைப்படுத்தி, பயன்படுத்துவத்தோடு மட்டுமல்லாமல், அதன் அடிப்படையில் முடிவுகளையும் எடுப்பது இவர்களுடைய வேலை.

மார்க்கெட் ரிசர்ட், போக்குவரத்து, கல்வி, விளையாட்டு, என எல்லா இடங்களிலும் இவர்களுடைய தேவை உண்டு. இந்த வேலைக்குள் நுழையவேண்டுமென்றால் பட்டப்படிப்பு அவசியம். அதிலும் குறிப்பாக  ஸ்டாடிஸ்டிக்ஸ் அல்லது கணிதவியலில் பட்டம் இருந்தால் ரொம்ப நல்லது.

இவர்களும் ஆர் போன்ற ஏதோ ஒரு மென்பொருளின் மீது அதிக பரிச்சயம் கொண்டிருக்க வேண்டியது அவசியம். இவர்களுடைய பணிக்கென பல மென்பொருட்கள் உள்ளன MATLAB, SAS, Python, Stata, Pig, Hive, SQL, Perl போன்றவை புள்ளிவிவரவியலாளர் அல்லது ஸ்டாட்டிஸ்டிஷியன் பணிக்கு உதவுவதற்காக இருக்கின்ற மென்பொருட்கள். இவற்றில் சிலவற்றைக் கற்றுக்கொள்வது பயனளிக்கும்.

தகவல்களை அலசி அதில் ஒரு பேட்டர்ன் அதாவது முறையைக் கண்டுபிடிப்பது, தகவல்களுக்கு இடையே உள்ள தொடர்பைக் கண்டுபிடிப்பது, ஒரு டிரென்ட் கண்டுபிடிப்பது போன்றவற்றையெல்லாம் இவர்கள் கவனிப்பார்கள்.

5

டேட்டா சயின்டிஸ்ட்

இன்றைக்கு இருக்கக் கூடிய தகவல் அறிவியல் வேலைகளில் ஹாட் வேலை என்றால் இது தான். இதற்கு கொஞ்சம் அனுபவம் இருக்க வேண்டும். எல்லா நிறுவனங்களிலும் டேட்டா சயின்டிஸ்ட் வேலை தேவை இருக்கும். ஒவ்வொரு நிறுவனத்துக்கும் கொஞ்சம் கொஞ்சம் வித்தியாசமான திறமைகளில் டேட்டா சயின்டிஸ்ட் தேவைப்படுவார்கள்.

மென்பொருட்களின் மீதான பரிச்சயம் இதற்கு மிக மிக அவசியம்.  R, SAS, Python, SQL, MatLab, Hive, Pig, மற்றும் Spark போன்றவை இதற்குத் தேவையான மென்பொருட்கள் !

ஒரு நல்ல தகவல் விஞ்ஞானியின் வேலை தகவல்களோடு முடிந்து விடுவதில்லை. அந்த தகவல்களுக்கும் நிறுவனத்துக்கும் இடையேயான பிணைப்பைக் கண்டறியும். அந்த தொடர்பை வைத்துக் கொண்டு எப்படியெல்லாம் பிஸினஸை வளர்த்தலாம் என்பதை அலசும்.

இந்த பணிக்கு ஆர்வமும், பொறுமையும் மிக மிக அவசியம். நல்ல தெளிவான சிந்தனையும், திறமையும் இருந்தால் இந்தத் துறையில் கலக்கலாம்.

ஒரு டேட்டா சயின்டிஸ்ட் என்பவர் சுருக்கமாகச் சொல்லவேண்டுமெனில் ஒரு டேட்டா அனலிஸ்ச்ட், ஒரு பொறியாளர், ஒரு பிஸினஸ் அனலிஸ்ட் போன்ற பலவற்றின் கலவையாக இருப்பார்.

6

டேட்டா எஞ்சினியர்

பெரும்பாலும் பிக்டேட்டா சார்ந்த பணிகளைக் கவனிப்பதற்கு டேட்டா எஞ்சினியர்கள் தேவைப்படுவார்கள். இவர்களை டேட்டா ஆர்கிடெக்ட் என்றும் அழைப்பார்கள்.

தகவல் பொறியாளர்களுக்கு கணினி பிரிவில் ஒரு பட்டப்படிப்பு அவசியம். கூடவே Pig, Hadoop, MapReduce, Hive, MySQL, Cassandra, MongoDB, NoSQL போன்றவற்றில் பரிச்சயம் இருப்பது தேவையானது. அதே போல மென்பொருட்களான R, Python, Ruby, C++, Perl, Java, SAS, SPSS, and Matlab போன்றவற்றில் நல்ல பரிச்சயம் இருக்க வேண்டியதும் மிக மிக அவசியம்.

தகவல்களை வகைப்படுத்துவது, அதை டெஸ்ட் செய்வது, அதை நிறுவனத்தின் தேவைக்கு ஏற்ப அறிக்கையாய், படங்களாய் சமர்ப்பிப்பது இவையே இவர்களுடைய முக்கியமான வேலை.

இவை தவிர, பிக்டேட்டா பொறியாளர், மெஷின் லேர்னிங் பொறியாளர் என பலர் இந்த தகவல் அறிவியல் துறையின் பட்டியலில் வருவார்கள்.

மேலே குறிப்பிட்டுள்ளவை தகவல் அறிவியல் துறையிலுள்ள சில முக்கியமான வேலைகள். இவற்றைத் தவிரவும் பல வேலைகள் தகவல் அறிவியல் துறையில் உண்டு. இந்தப் பணிகளுக்குத் தேவையான திறமைகளை வளர்த்துக் கொண்டால் தகவல் அறிவியல் துறையில் நுழைவதில் சிக்கல் இருக்காது.

Data Science 3 : தகவல் அறிவியல் ‍ 3

Image result for data science

தகவல் அறிவியலின் பரபர வளர்ச்சி இன்றைக்கு இளைஞர்களை வெகுவாக‌ வசீகரித்திருக்கிறது. அதை நோக்கி பலர் தங்களுடைய பார்வையைத் திருப்பியிருக்கின்றனர். இதையே வாய்ப்பாக வைத்துக் கொண்டு பலர் ஃபாஸ்ட் புட் போல‌ பயிற்சி நிலையங்களை உருவாக்கி தகவல் அறிவியல் கற்றுத் தருகிறேன் என வலை விரிக்கத் துவங்கியிருக்கின்றனர். பயிற்சி நிலையம் சின்னதாக இருக்கிறதா ? பெரியதாக இருக்கிறதா என்பதல்ல பிரச்சினை. சரியான விதத்தில், சரியானவர்களால், சரியானவைகளைக் கற்றுத் தருகிறார்களா என்பதே முக்கியம்.

தகவல் அறிவியல் மீதான வசீகரம் இருப்பது நல்லது தான். நீச்சல் தெரியாமல் குளத்தில் குதிப்பதைப் போலவோ, நீச்சலே பிடிக்காமல் குளத்தில் குதிப்பதைப் போலவோ டேட்டா சயின்ஸ் துறையில் நுழைவது காலவிரயம் ! யாரெல்லாம் தகவல் அறிவியலைக் கற்றுக் கொள்ளலாம் ?. அல்லது டேட்டா சயின்ஸைக் கற்றுக் கொள்ள  என்னென்ன திறமைகள் இருக்க வேண்டும் ? என்பதைப் பற்றிய ஒரு அடிப்படைப் புரிதல் நமக்கு இருக்க வேண்டும்.

இன்றைக்கு தகவல் அறிவியலைக் குறித்து பேசும் பலரும் பல விதமான தகவல்களைத் தருகின்றனர். இதில் எது சரி, எது தவறு என்பதைப் புரிந்து கொள்வதில் பலருக்கும் குழப்பம். ஹடூப், மெஷின் லேர்னிங், அனாலிடிக்ஸ், சயின்டிஸ்ட் போன்ற வார்த்தைகள் தகவல் அறிவியல் துறையில் நுழைய விரும்பும் இளைஞர்களை குழப்பக் கூடும். எனவே தகவல் அறிவியல் குறித்து இதுவரை மற்றவர்கள் சொன்ன விஷயங்களை கொஞ்ச நேரம் ஒதுக்கி வையுங்கள். தகவல் அறிவியலுக்குள் நுழைய அடிப்படையாக என்னென்ன தேவை என்பதை மிக மிகச் சுருக்கமாகப் பார்த்து விடுவோம்.

முதலாவது, தகவல் அறிவியல் என்பது எண்களோடு விளையாடும் வேலை. புள்ளி விவரங்கள், கூட்டல், கழித்தல், அல்காரிதம், கேல்குலஸ், நிகழ்தகவு போன்ற விஷயங்கள் தகவல் அறிவியலின் முதுகெலும்பாக இயங்கக் கூடியவை. இவை எல்லாமே கணிதவியலின் அடிப்படை விஷயங்கள். எனவே, தகவல் அறிவியல் கற்றுக் கொள்ள விரும்புபவர்களுக்கு முதலில் இருக்க வேண்டிய தகுதி, கணிதவியலில் அறிவு.

அதற்காக கணிதவியலில் இளங்கலைப் பட்டமோ, முதுகலைப் பட்டமோ இருந்தால் தான் தகவல் அறிவியலில் நுழைய முடியும் என்றில்லை. கணிதத்தின் மீது ஆர்வமும், அடிப்படை அறிவும், கற்றுக் கொள்ளும் விருப்பமும் இருந்தால் போதும். கணிதம் என்றாலே காத தூரம் ஓடுபவர்கள் தகவல் அறிவியல் பக்கம் வராமல் இருப்பது நல்லது அப்படிப்பட்டவர்களுக்கு தேவையற்ற மன அழுத்தங்களை தகவல் அறிவியல் தரலாம்

தகவல் அறிவியல் துறைக்கு பல்வேறு நிலையிலுள்ள மக்களும் வருகின்றனர். இப்போது தான் படித்து முடித்த மாணவர்கள் முதல் பி.ஹைச்.டி முடித்த அறிவர்கள் வரை இதில் அடக்கம். அதனால் சிலர், “பி.ஹைச்.டி படித்தால் தான் இதெல்லாம் புரியும் போல !”, என தவறாய் நினைப்பதுண்டு. அந்த நினைப்புகளையெல்லாம் முளையிலேயே கிள்ளி எறியுங்கள்.

இரண்டாவது தேவை, கணினி அறிவு. மென்பொருள் எழுதத் தெரிந்திருக்க வேண்டும் என்பது அடிப்படைத் தேவை. அட்வான்ஸ் மென்பொருட்கள் தெரிந்திருக்க வேண்டியதில்லை. அவற்றைப் படிப்படியாகக் கற்றுக் கொள்ளலாம். ஆனால் அடிப்படை மென்பொருள் அறிவு கண்டிப்பாகத் தேவை. தகவல்களை அல்காரிதங்களின் மூலமாய் தேவையான தகவல்களாக மாற்றுவதற்கு மென்பொருள் அறிவு அவசியம்.

பைத்தான். ஆர் போன்ற மென்பொருட்கள் தெரிந்திருந்தால் மிக எளிது. இல்லாவிட்டாலும் பிரச்சினையில்லை. அடிப்படை மென்பொருட்களான சி, சி++, ஜாவா போன்ற மென்பொருட்களில் நல்ல பரிச்சயம் இருந்தாலே போதும். மென்பொருள் பற்றிய பரிச்சயம் அறவே இல்லை என்பவர்களால் தகவல் அறிவியல் துறையில் நுழைய முடியாது. எனவே கொஞ்சம் புரோகிராமிங் பக்கம் பார்வையை செலுத்துவது அவசியம்.

அதிலும், டேட்டா பேஸ் எனப்படும் தகவல் சேமிப்பு மென்பொருட்கள் பற்றிய அறிவு நிச்சயம் இருக்கவேண்டும். எப்படியெல்லாம் தகவல்களை சேமிக்கலாம், அதை எந்தெந்த வகையில் எடுக்கலாம், எப்படியெல்லாம் வகைப்படுத்தலாம், என்னென்ன கேள்விகள் மூலம் தகவல்களைப் பிரித்தெடுக்கலாம் என்பதையெல்லாம் கற்றுக் கொள்ள எஸ்.க்யூ.எல் அடிப்படை அறிவு இருப்பது தேவையானது ! இங்கும் கவனிக்க வேண்டிய விஷயம், இதிலெல்லாம் சூப்பர் டூப்பர் ஆட்களாய் இருக்க வேண்டிய அவசியம் இல்லை என்பது தான். ஆனால் நன்றாகத் தெரிந்திருக்க வேண்டும் என்பது கட்டாயம்.

டொமைன் ஸ்கில்ஸ் எனப்படும் கள அறிவு தகவல் அறிவியல் துறையில் முக்கியமானது. ஆனால் இதை துவக்கத்திலேயே படித்து விட முடியாது. நாம் எந்த துறையில் தகவல் அறிவியல் பணி செய்யப் போகிறோமோ அந்தத் துறை சார்ந்த விஷயங்களைக் கற்றுக் கொள்வது தான் சரியானது. உதாரணமாக மருத்துவத் துறையில் தான் தகவல் அறிவியல் வேலை செய்யப் போகிறீர்கள் என்றால், “ஹெல்த்கேர்’ டொமைன் பற்றி நன்றாகத் தெரிந்து வைத்திருப்பது அவசியம்.

தகவல் அறிவியல் கொண்டு வருகின்ற முடிவுகளை அலசவும், எப்படிப்பட்ட முடிவுகள் பயன்படும் என்பதை முடிவு செய்யவும் டொமைன் ஸ்கில்ஸ் தேவை. மருந்துகளின் தேவைகள் பற்றிய புள்ளிவிவரத்தை அதைப்பற்றி எதுவுமே தெரியாதவர்கள் படித்தால் புரியாது இல்லையா ? அது தான் அடிப்படை விஷயம்.

வங்கித் துறை சார்ந்த தகவல் அறிவியல் எனில் பேங்கிங் டொமைன் கற்றுக் கொள்ள வேண்டும். காப்பீடு துறை சார்ந்த டேட்டா சயின்ஸ் பணியெனில் ‘இன்சூரன்ஸ் டொமைன்’ கற்றுக் கொள்ள வேண்டும். வணிகம் சார்ந்த ஏரியா எனில் ‘ரிடெயில் டொமைன்’ தெரிந்திருக்க வேண்டும். இப்படி தேவையான ஒன்றைத் தெரிந்து கொள்ளலாம். டொமைன் ஸ்கில்ஸ் எனப்படுவதை ஒரே நாளிலோ, ஒரு படிப்பின் மூலமாகவோ கற்றுக் கொள்ள முடியாது. அடிப்படை அறிவைப் பெற்றுக் கொண்டு பின்னர் படிப்படியாக அதை வளப்படுத்திக் கொள்ளலாம்.

தகவலை விஷுவலைஸ் செய்து பார்ப்பது, அதாவது கற்பனை செய்து பார்ப்பது என்பது இந்த படிப்புக்கு தேவையானது. ஒரு துப்பறிவாளன் கையில் கிடைக்கும் ஒரு சின்ன பொருள் ஒரு பெரிய குற்றத்தைத் துப்பு துலக்க உதவுவது போல, தகவல் அறிவியலாளனின் கையில் கிடைக்கின்ற தகவல்கள் மிகப்பெரிய மாற்றத்துக்குரிய விடையைத் தர முடியும். அதற்கு, ‘இந்த தகவலை வைத்து என்ன செய்யலாம்’ என கற்பனை செய்து பார்க்கும் விஷுவலைசிங் திறமை அவசியம்.

அடிப்படையாக ஒரு பட்டப்படிப்பு இருப்பது ரொம்ப நல்லது. கணிதம், அறிவியல், காமர்ஸ் போன்ற பட்டப்படிப்பு இருந்தால் சிறப்பு !  பட்டப்படிப்பு இந்தத் துறையில் உங்களை முழுமையாக ஈடுபடுத்திக் கொள்ளும் ஊக்கத்தைத் தரும். ஒருவேளை வேறு நிறுவனங்களில், துறைகளில் வேலைபார்த்த அனுபவம் உடையவர்கள் பட்டப்படிப்பு இல்லாமலும் இந்த துறையில் நுழையலாம்.

கம்யூனிகேஷன் ஸ்கில்ஸ் எனப்படும் உரையாடல் திறனும் இந்த துறைக்கு ரொம்பவே கை கொடுக்கும். தகவல்கள் எப்போதும் நமக்கு எளிதில் கிடைத்து விடுவதில்லை. அதற்கு நமது உரையாடல்கள் தேவைப்படும். அதே போல, நாம் உருவாக்குகின்ற பணிகளை மிகத் திறமையாக அடுத்தவர்களுக்கு எடுத்துரைக்கவும் கம்யூனிகேஷன் திறமை மிக அவசியம்.

எல்லாவற்றுக்கும் மேலாக இருக்க வேண்டிய இரண்டு முக்கியமான விஷயங்கள் உற்சாகமும், புதுமையை விரும்பும் மனமும். தகவல்களை எப்படியெல்லாம் பயன்படுத்தலாம், எப்படியெல்லாம் அலசலாம், எப்படிப்பட்ட வகைகளில் வகைப்படுத்தலாம் என்பதெல்லாம் புதுமையை விரும்புபவர்களால் மட்டுமே முடிவு செய்ய முடியும். நூல் கண்டு போல சுற்றிப் பிணைந்து கிடக்கின்ற தகவல்களை சிக்கலில்லாமல் பிரித்தெடுக்க, தேவையற்ற தகவல்களை வெட்டி எறிய உற்சாக மனம் ரொம்ப முக்கியம். அடிப்படையாக, பிசினஸை எப்படியெல்லாம் வளப்படுத்தலாம், வலுப்படுத்தலாம் எனும் சிந்தனை ஓடிக்கொண்டே இருக்க வேண்டும். இவையெல்லாம் தான் ஒருவரை தகவல் அறிவியலில் சிறப்புற வைக்கும்.

சுருக்கமாக கணிதத்தில் பரிச்சயமும் ஆர்வமும் இருக்கிறதா ? ஓரளவு மென்பொருள் பரிச்சயம் இருக்கிறதா ? புதுமை செய்யும் ஆர்வம் இருக்கிறதா ? தகவல்களோடு விளையாடும் பொறுமை இருக்கிறதா ? எனில் நீங்கள் தைரியமாக இதில் காலெடுத்து வைக்கலாம்.

( தொடர்வோம் )