எழுத்துரு பிரச்னைகள்

இந்தக் குறிப்பு எழுத்தாளர்களுக்கும் பதிப்பாளர்களுக்கும் மட்டுமானது. மற்றவர்கள் கடந்துவிடலாம்.

தமிழ்நாட்டில் எத்தனை பதிப்பகங்கள் உண்டோ, அத்தனை எழுத்துருக்களும் உண்டு. ஒவ்வொரு பதிப்பகமும் ஒவ்வொரு விதமான எழுத்துரு / என்கோடிங்கில் இவ்வளவு காலம் புத்தகங்களை அச்சிட்டு வந்திருக்கின்றன. இதில் மென்பொருள் என்றே சொல்ல முடியாத வன்னெழுத்துருக்களும் சேர்த்தி. (key உள்ள எழுத்துரு ஒன்றை நானே பயன்படுத்தியிருக்கிறேன்.) இளங்கோ, கம்பன், பாரதி, கன்னியப்பன், முனியம்மா என்று இஷ்டத்துக்கு ஒரு பெயரில் எவ்வளவோ tam, tab என்கோடிங் எழுத்துருக்கள். இதில் ஈழத்து எழுத்தாளர்கள் பயன்படுத்தும் (அல்லது பாவிக்கும்) பாமினி தனி ரகம். யுனிகோட் வந்தபின்பு அதிலும் நூற்றுக்கணக்கான எழுத்துருக்கள். ஆனால் அச்சுலகம் இன்னும் யுனிகோடை ஆதரிக்கத் தொடங்கவில்லை.

கிண்டிலின் வருகைக்குப் பிறகு இந்த சாதிப் பிரிவினை முற்றிலுமாகத் தமிழில் களையப்பட்டிருக்கிறது. யுனிகோட் மட்டும்தான். அதிலும் அவனே கொடுக்கும் ஏதோ ஒரு எழுத்துரு மட்டும்தான். நாம் எந்த யுனிகோட் எழுத்துருவில் எழுதியிருந்தாலும் பிரசுரமாகும்போது அது கிண்டிலில் உள்ள யுனிகோட் எழுத்துருவில்தான் காட்சியளிக்கும். ஆங்கிலத்தில் உள்ளது போல விதவிதமான எழுத்துருக்களைப் பயன்படுத்தும் சாத்தியங்கள் இல்லை. ஒருவேளை நாளை வரலாம். ஆனால் யுனிகோடில் மட்டுமே அது இருக்கும். பிற என்கோடிங்குகளுக்கு இனி வேலையில்லை.

இனி மின்நூல்களைத் தவிர்க்க இயலாது என்னும் சூழலில் பதிப்பகங்களும் எழுத்தாளர்களும் தமது வசம் இருக்கும் புத்தகப் பிரதிகளை யுனிகோடுக்கு மாற்றும்போது என்னென்ன விதமான சிக்கல்கள் வருகின்றன என்று சிறிது ஆராய்ந்தேன்.

1. ஸ்ரீலிபியில் இருந்து மத மாற்றம் செய்தால் ஆங்கிலச் சொற்கள் சேர்ந்து மாறாது. முழுப் புத்தகத்தையும் வரி வரியாகப் படித்து எங்கெல்லாம் ஆங்கிலச் சொற்கள் கசமுசவென்று மாறியிருக்கிறதோ, அவற்றை நீக்கிவிட்டு சரியான சொற்களை மீண்டும் டைப் செய்ய வேண்டும். முன்பு என்ன எழுதியிருந்தோம் என்று நினைவில்லாதிருந்தால் தீர்ந்தது. அச்சான பிரதியில் பக்கம் தேடி எடுத்து வைத்துக்கொண்டு சரி பார்க்க வேண்டும். ஓரிரு இடங்களில் சரி செய்யலாம். ஆயிரம் பக்கப் புத்தகமென்றால் என்ன செய்ய முடியும்?

2. பழைய பரணர் போன்ற டிஸ்கி/யுனிகோட் எழுத்துரு என்றால் வடமொழி எழுத்துகள் கலந்த சொற்கள் கண்டபடி உருப்பெருக்கும். உதாரணமாக எனது ஹிஸ்புல்லா புத்தகத்தை நான் இன்றுவரை கிண்டிலில் சேர்க்க இயலாதிருப்பதன் காரணம் ஒன்றுதான். TSCU Paranar-ல் எழுதப்பட்ட அப்புத்தகத்தை கிண்டில் வடிவத்துக்கு மாற்றுகையில் ஹிஸ்புல்லா என்னும் சொல் எங்கெல்லாம் வருகிறதோ அங்கெல்லாம் ‘ஹிஸ்புல்லாஹிஸ்புல்லா’ என்று இரட்டைக் கிளவியாகிவிடுகிறது. Global search / replace செய்தும் இதனை மாற்ற முடிவதில்லை. அப்படிச் செய்ய முற்பட்டால் இரண்டாவது ஹிஸ்புல்லாவின் இறுதித் துணையெழுத்து (லா-வில் உள்ள கால்) மட்டும் இரண்டு, மூன்று, நான்கு என்று இஷ்டத்துக்கு வருகிறது. இப்படி:- ஹிஸ்புல்லாாா.

3. Tab என்கோடிங்கில் உள்ள புத்தகத்தை யுனிகோடுக்கு மாற்றும்போது கொட்டேஷன்கள் வேண்டாத மாமியார், வேண்டாத மருமகள்களைப் போல இந்தப் பக்கமும் அந்தப் பக்கமுமாகத் திரும்பி நிற்கின்றன. (open quoteகள் close quote போலவும், close quoteகள் open quote போலவும்.)

4. Tamல் உள்ள பிரதிகளில் சிறிய ஹைஃபன்கள் சரியாக வருவதில்லை. அவை underscore ஆக மாறிவிடுகின்றன. அல்லது இந்திக்காரப் பிரதியைப் போல சில இடங்களில் எழுத்துக்கு மேலே பட்டையாகக் கோடு விழுகிறது. க்ஷ போன்ற வடமொழி எழுத்துகள் கண்ணராவியாக வருகின்றன. மொத்தப் பிரதியின் அளவு ஒன்றென்றால் இந்த எழுத்துகள் மட்டும் நடுவே நிறைமாத கர்ப்பிணி போல வயிற்றைத் தூக்கிகொண்டு எழுந்து நிற்கின்றன. பார்க்கச் சகிக்கவில்லை.

5. மேற்சொன்ன எந்த வரையறைக்குள்ளும் அடங்காத எழுத்துரு மாற்றக் குளறுபடிகளும் உண்டு. அவை ஏன் ஏற்படுகின்றன என்றே புரிவதில்லை. உதாரணமாக shree-tam 800என்னும் எழுத்துருவில் எழுதப்பட்ட எனது பாக். ஒரு புதிரின் சரிதம் புத்தகத்தை யுனிகோடுக்கு மாற்றினேன். இதில் அயூப் கான் என்று வருகிற அனைத்து இடங்களிலும் அயூபின் புள்ளி காணாமல் போயிருந்தது. மொத்தப் புத்தகமும் அயூப கான் என்றே இருந்தது. வேறு வழி? வரி வரியாகப் படித்துத் திருத்த வேண்டியதானது. (ஆனால் மற்ற சில shree tam புத்தகங்களில் இப்படி ஆகவில்லை. அதற்கும் காரணம் தெரியவில்லை.)

6. இதுவும் போக இன்னொரு சிக்கல், பிடிஎஃப் பிரதிகளை கூகுள் டிரைவில் ஏற்றி, கூகுள் டாக்கில் திறக்கும்போது வருகிற பிழைகள். இன்னதுதான் என்றே சொல்ல முடியாத பல நூதனப் பிரச்னைகள் அதில் வருகின்றன. முழுவதையும் எழுத்தெழுத்தாகப் படித்துப் பார்த்து சரி செய்வதற்கு பதில் புதிதாக டைப் செய்துவிடலாம் என்றே தோன்றிவிடுகிறது.

இதற்கெல்லாம் ஒரே தீர்வு ஒரு சிறந்த கன்வர்ட்டர் உருவாக்குவது அல்லது இருக்கும் கன்வர்ட்டர்களின் தரத்தை மேம்படுத்துவது என்பீர்களானால் பேச்சே இல்லை. அது இந்த ஜென்மத்தில் நடக்கப் போவதும் இல்லை.

இனி எழுதும் புத்தகங்களை, பதிப்பிக்கும் புத்தகங்களை யுனிகோடில் செய்வதுதான் எதிர்காலத்தில் இப்பிரச்னை நீடிக்காதிருக்க ஒரே வழி. அனைத்து விதமான எழுத்துருக்களுக்கும் ஒரு யுனிகோட் வர்ஷன் இதனால் அவசியமாகிறது. நிறுவனங்கள் இதனைச் செய்து விற்பனைக்குத் தர ஆரம்பிக்கலாம். இன்றுவரை யுனிகோடில் நமக்குக் கிடைக்கும் எழுத்துருக்கள் புத்தகப் பதிப்புக்கு ஏற்றதாக இல்லை. காரணம், அனைவருக்கும் இலவசமாகக் கிடைப்பதற்காகத் தன்னார்வலர்கள் உருவாக்கும் எழுத்துருக்கள் அவை. செய் நேர்த்தி போதாது. புத்தகப் பதிப்பில் பயன்படும் எழுத்துருக்களைப் போலவே சில யுனிகோட் எழுத்துருக்கள் இருக்கின்றன. ஆனாலும் அவ்வளவு துல்லியம் கிடையாது. Uni Ilasundaram 4, TAU_Ilango_Valluvar போன்ற மிகச் சில (அநேகமாக இந்த இரண்டு மட்டும்!) எழுத்துருக்கள் ஓரளவு அச்செழுத்துருக்களுக்குப் பக்கமாக வருபவை. இவற்றிலுமேகூட, தலைப்பு எழுத்துருக்கள் அவ்வளவு நன்றாக இராது.

மின்நூல் / அச்சுப் பதிப்பு இரண்டுமே இனி வரும் நாள்களில் அனைத்து எழுத்தாளர்களும் இங்கே நேரடியாகத் தயாரிக்கும் பொருள்களாக மாறிவிடும். (அல்லது ஆள் வைத்து அவரவர் புத்தகங்களை அவரவரே பதிப்பிப்பது.) பதிப்பகம் என்ற நடு நிறுவனத்தின் தேவை பெருமளவு குறையும். on demand printingதான் இனி நடைமுறையில் இருக்கும் (இப்போதே அப்படித்தான்.) அமேசான் போன்ற நிறுவனங்கள் (கூகுள் புக்ஸ், ஆப்பிள் புக்ஸும் விரைவில் இதில் சேரும்) தமிழுக்கும் இதனைக் கையில் எடுக்கும்போது எழுத்தாளர்கள் அச்சுப்பிரதி, மின்நூல் இரண்டையும் சொந்தமாக, முன் முதலீடின்றித் தயாரித்துக்கொள்ள முடியும். தேவைப்படும் பிரதிகளை மட்டும் சம்பந்தப்பட்ட தளத்தில் பணம் கொடுத்து வாங்கிக்கொள்ளலாம். அதை வெளியே கடைகளில் கொடுத்தோ, புத்தகக் காட்சியிலோ விற்கவும் செய்யலாம். (அமேசானில் இது இப்போதே ஆங்கிலத்தில் உண்டு.)

தமிழுக்கு அந்நாள் வரும்போது பிரதிகள் யுனிகோடில் தயாராக இல்லாவிட்டால் பின்தங்கிப் போக நேரிடும்.

எனவே, கையில் உள்ள பிரதிகளை முதலில் யுனிகோடில் மாற்றி வைத்துக்கொள்ளுங்கள். அச்சிடும் புத்தகங்களையும் யுனிகோடிலேயே அச்சிடுவதற்கு வழி பாருங்கள். இனி எழுதும் எதையும் அதிலேயே செய்யுங்கள். இல்லாவிட்டால் என்னைப் போல் முதுகு ஒடிய கன்வர்ஷனில் வேலை செய்து களைக்க வேண்டி வரும்.

Share
By Para

தொகுப்பு

Recent Posts

அஞ்சல் வழி


Links

RSS Feeds

எழுத்துக் கல்வி

error: Content is protected !!