எழுத்துரு பிரச்னைகள்

இந்தக் குறிப்பு எழுத்தாளர்களுக்கும் பதிப்பாளர்களுக்கும் மட்டுமானது. மற்றவர்கள் கடந்துவிடலாம்.

தமிழ்நாட்டில் எத்தனை பதிப்பகங்கள் உண்டோ, அத்தனை எழுத்துருக்களும் உண்டு. ஒவ்வொரு பதிப்பகமும் ஒவ்வொரு விதமான எழுத்துரு / என்கோடிங்கில் இவ்வளவு காலம் புத்தகங்களை அச்சிட்டு வந்திருக்கின்றன. இதில் மென்பொருள் என்றே சொல்ல முடியாத வன்னெழுத்துருக்களும் சேர்த்தி. (key உள்ள எழுத்துரு ஒன்றை நானே பயன்படுத்தியிருக்கிறேன்.) இளங்கோ, கம்பன், பாரதி, கன்னியப்பன், முனியம்மா என்று இஷ்டத்துக்கு ஒரு பெயரில் எவ்வளவோ tam, tab என்கோடிங் எழுத்துருக்கள். இதில் ஈழத்து எழுத்தாளர்கள் பயன்படுத்தும் (அல்லது பாவிக்கும்) பாமினி தனி ரகம். யுனிகோட் வந்தபின்பு அதிலும் நூற்றுக்கணக்கான எழுத்துருக்கள். ஆனால் அச்சுலகம் இன்னும் யுனிகோடை ஆதரிக்கத் தொடங்கவில்லை.

கிண்டிலின் வருகைக்குப் பிறகு இந்த சாதிப் பிரிவினை முற்றிலுமாகத் தமிழில் களையப்பட்டிருக்கிறது. யுனிகோட் மட்டும்தான். அதிலும் அவனே கொடுக்கும் ஏதோ ஒரு எழுத்துரு மட்டும்தான். நாம் எந்த யுனிகோட் எழுத்துருவில் எழுதியிருந்தாலும் பிரசுரமாகும்போது அது கிண்டிலில் உள்ள யுனிகோட் எழுத்துருவில்தான் காட்சியளிக்கும். ஆங்கிலத்தில் உள்ளது போல விதவிதமான எழுத்துருக்களைப் பயன்படுத்தும் சாத்தியங்கள் இல்லை. ஒருவேளை நாளை வரலாம். ஆனால் யுனிகோடில் மட்டுமே அது இருக்கும். பிற என்கோடிங்குகளுக்கு இனி வேலையில்லை.

இனி மின்நூல்களைத் தவிர்க்க இயலாது என்னும் சூழலில் பதிப்பகங்களும் எழுத்தாளர்களும் தமது வசம் இருக்கும் புத்தகப் பிரதிகளை யுனிகோடுக்கு மாற்றும்போது என்னென்ன விதமான சிக்கல்கள் வருகின்றன என்று சிறிது ஆராய்ந்தேன்.

1. ஸ்ரீலிபியில் இருந்து மத மாற்றம் செய்தால் ஆங்கிலச் சொற்கள் சேர்ந்து மாறாது. முழுப் புத்தகத்தையும் வரி வரியாகப் படித்து எங்கெல்லாம் ஆங்கிலச் சொற்கள் கசமுசவென்று மாறியிருக்கிறதோ, அவற்றை நீக்கிவிட்டு சரியான சொற்களை மீண்டும் டைப் செய்ய வேண்டும். முன்பு என்ன எழுதியிருந்தோம் என்று நினைவில்லாதிருந்தால் தீர்ந்தது. அச்சான பிரதியில் பக்கம் தேடி எடுத்து வைத்துக்கொண்டு சரி பார்க்க வேண்டும். ஓரிரு இடங்களில் சரி செய்யலாம். ஆயிரம் பக்கப் புத்தகமென்றால் என்ன செய்ய முடியும்?

2. பழைய பரணர் போன்ற டிஸ்கி/யுனிகோட் எழுத்துரு என்றால் வடமொழி எழுத்துகள் கலந்த சொற்கள் கண்டபடி உருப்பெருக்கும். உதாரணமாக எனது ஹிஸ்புல்லா புத்தகத்தை நான் இன்றுவரை கிண்டிலில் சேர்க்க இயலாதிருப்பதன் காரணம் ஒன்றுதான். TSCU Paranar-ல் எழுதப்பட்ட அப்புத்தகத்தை கிண்டில் வடிவத்துக்கு மாற்றுகையில் ஹிஸ்புல்லா என்னும் சொல் எங்கெல்லாம் வருகிறதோ அங்கெல்லாம் ‘ஹிஸ்புல்லாஹிஸ்புல்லா’ என்று இரட்டைக் கிளவியாகிவிடுகிறது. Global search / replace செய்தும் இதனை மாற்ற முடிவதில்லை. அப்படிச் செய்ய முற்பட்டால் இரண்டாவது ஹிஸ்புல்லாவின் இறுதித் துணையெழுத்து (லா-வில் உள்ள கால்) மட்டும் இரண்டு, மூன்று, நான்கு என்று இஷ்டத்துக்கு வருகிறது. இப்படி:- ஹிஸ்புல்லாாா.

3. Tab என்கோடிங்கில் உள்ள புத்தகத்தை யுனிகோடுக்கு மாற்றும்போது கொட்டேஷன்கள் வேண்டாத மாமியார், வேண்டாத மருமகள்களைப் போல இந்தப் பக்கமும் அந்தப் பக்கமுமாகத் திரும்பி நிற்கின்றன. (open quoteகள் close quote போலவும், close quoteகள் open quote போலவும்.)

4. Tamல் உள்ள பிரதிகளில் சிறிய ஹைஃபன்கள் சரியாக வருவதில்லை. அவை underscore ஆக மாறிவிடுகின்றன. அல்லது இந்திக்காரப் பிரதியைப் போல சில இடங்களில் எழுத்துக்கு மேலே பட்டையாகக் கோடு விழுகிறது. க்ஷ போன்ற வடமொழி எழுத்துகள் கண்ணராவியாக வருகின்றன. மொத்தப் பிரதியின் அளவு ஒன்றென்றால் இந்த எழுத்துகள் மட்டும் நடுவே நிறைமாத கர்ப்பிணி போல வயிற்றைத் தூக்கிகொண்டு எழுந்து நிற்கின்றன. பார்க்கச் சகிக்கவில்லை.

5. மேற்சொன்ன எந்த வரையறைக்குள்ளும் அடங்காத எழுத்துரு மாற்றக் குளறுபடிகளும் உண்டு. அவை ஏன் ஏற்படுகின்றன என்றே புரிவதில்லை. உதாரணமாக shree-tam 800என்னும் எழுத்துருவில் எழுதப்பட்ட எனது பாக். ஒரு புதிரின் சரிதம் புத்தகத்தை யுனிகோடுக்கு மாற்றினேன். இதில் அயூப் கான் என்று வருகிற அனைத்து இடங்களிலும் அயூபின் புள்ளி காணாமல் போயிருந்தது. மொத்தப் புத்தகமும் அயூப கான் என்றே இருந்தது. வேறு வழி? வரி வரியாகப் படித்துத் திருத்த வேண்டியதானது. (ஆனால் மற்ற சில shree tam புத்தகங்களில் இப்படி ஆகவில்லை. அதற்கும் காரணம் தெரியவில்லை.)

6. இதுவும் போக இன்னொரு சிக்கல், பிடிஎஃப் பிரதிகளை கூகுள் டிரைவில் ஏற்றி, கூகுள் டாக்கில் திறக்கும்போது வருகிற பிழைகள். இன்னதுதான் என்றே சொல்ல முடியாத பல நூதனப் பிரச்னைகள் அதில் வருகின்றன. முழுவதையும் எழுத்தெழுத்தாகப் படித்துப் பார்த்து சரி செய்வதற்கு பதில் புதிதாக டைப் செய்துவிடலாம் என்றே தோன்றிவிடுகிறது.

இதற்கெல்லாம் ஒரே தீர்வு ஒரு சிறந்த கன்வர்ட்டர் உருவாக்குவது அல்லது இருக்கும் கன்வர்ட்டர்களின் தரத்தை மேம்படுத்துவது என்பீர்களானால் பேச்சே இல்லை. அது இந்த ஜென்மத்தில் நடக்கப் போவதும் இல்லை.

இனி எழுதும் புத்தகங்களை, பதிப்பிக்கும் புத்தகங்களை யுனிகோடில் செய்வதுதான் எதிர்காலத்தில் இப்பிரச்னை நீடிக்காதிருக்க ஒரே வழி. அனைத்து விதமான எழுத்துருக்களுக்கும் ஒரு யுனிகோட் வர்ஷன் இதனால் அவசியமாகிறது. நிறுவனங்கள் இதனைச் செய்து விற்பனைக்குத் தர ஆரம்பிக்கலாம். இன்றுவரை யுனிகோடில் நமக்குக் கிடைக்கும் எழுத்துருக்கள் புத்தகப் பதிப்புக்கு ஏற்றதாக இல்லை. காரணம், அனைவருக்கும் இலவசமாகக் கிடைப்பதற்காகத் தன்னார்வலர்கள் உருவாக்கும் எழுத்துருக்கள் அவை. செய் நேர்த்தி போதாது. புத்தகப் பதிப்பில் பயன்படும் எழுத்துருக்களைப் போலவே சில யுனிகோட் எழுத்துருக்கள் இருக்கின்றன. ஆனாலும் அவ்வளவு துல்லியம் கிடையாது. Uni Ilasundaram 4, TAU_Ilango_Valluvar போன்ற மிகச் சில (அநேகமாக இந்த இரண்டு மட்டும்!) எழுத்துருக்கள் ஓரளவு அச்செழுத்துருக்களுக்குப் பக்கமாக வருபவை. இவற்றிலுமேகூட, தலைப்பு எழுத்துருக்கள் அவ்வளவு நன்றாக இராது.

மின்நூல் / அச்சுப் பதிப்பு இரண்டுமே இனி வரும் நாள்களில் அனைத்து எழுத்தாளர்களும் இங்கே நேரடியாகத் தயாரிக்கும் பொருள்களாக மாறிவிடும். (அல்லது ஆள் வைத்து அவரவர் புத்தகங்களை அவரவரே பதிப்பிப்பது.) பதிப்பகம் என்ற நடு நிறுவனத்தின் தேவை பெருமளவு குறையும். on demand printingதான் இனி நடைமுறையில் இருக்கும் (இப்போதே அப்படித்தான்.) அமேசான் போன்ற நிறுவனங்கள் (கூகுள் புக்ஸ், ஆப்பிள் புக்ஸும் விரைவில் இதில் சேரும்) தமிழுக்கும் இதனைக் கையில் எடுக்கும்போது எழுத்தாளர்கள் அச்சுப்பிரதி, மின்நூல் இரண்டையும் சொந்தமாக, முன் முதலீடின்றித் தயாரித்துக்கொள்ள முடியும். தேவைப்படும் பிரதிகளை மட்டும் சம்பந்தப்பட்ட தளத்தில் பணம் கொடுத்து வாங்கிக்கொள்ளலாம். அதை வெளியே கடைகளில் கொடுத்தோ, புத்தகக் காட்சியிலோ விற்கவும் செய்யலாம். (அமேசானில் இது இப்போதே ஆங்கிலத்தில் உண்டு.)

தமிழுக்கு அந்நாள் வரும்போது பிரதிகள் யுனிகோடில் தயாராக இல்லாவிட்டால் பின்தங்கிப் போக நேரிடும்.

எனவே, கையில் உள்ள பிரதிகளை முதலில் யுனிகோடில் மாற்றி வைத்துக்கொள்ளுங்கள். அச்சிடும் புத்தகங்களையும் யுனிகோடிலேயே அச்சிடுவதற்கு வழி பாருங்கள். இனி எழுதும் எதையும் அதிலேயே செய்யுங்கள். இல்லாவிட்டால் என்னைப் போல் முதுகு ஒடிய கன்வர்ஷனில் வேலை செய்து களைக்க வேண்டி வரும்.