எழுத்துரு பிரச்னைகள்

இந்தக் குறிப்பு எழுத்தாளர்களுக்கும் பதிப்பாளர்களுக்கும் மட்டுமானது. மற்றவர்கள் கடந்துவிடலாம்.

தமிழ்நாட்டில் எத்தனை பதிப்பகங்கள் உண்டோ, அத்தனை எழுத்துருக்களும் உண்டு. ஒவ்வொரு பதிப்பகமும் ஒவ்வொரு விதமான எழுத்துரு / என்கோடிங்கில் இவ்வளவு காலம் புத்தகங்களை அச்சிட்டு வந்திருக்கின்றன. இதில் மென்பொருள் என்றே சொல்ல முடியாத வன்னெழுத்துருக்களும் சேர்த்தி. (key உள்ள எழுத்துரு ஒன்றை நானே பயன்படுத்தியிருக்கிறேன்.) இளங்கோ, கம்பன், பாரதி, கன்னியப்பன், முனியம்மா என்று இஷ்டத்துக்கு ஒரு பெயரில் எவ்வளவோ tam, tab என்கோடிங் எழுத்துருக்கள். இதில் ஈழத்து எழுத்தாளர்கள் பயன்படுத்தும் (அல்லது பாவிக்கும்) பாமினி தனி ரகம். யுனிகோட் வந்தபின்பு அதிலும் நூற்றுக்கணக்கான எழுத்துருக்கள். ஆனால் அச்சுலகம் இன்னும் யுனிகோடை ஆதரிக்கத் தொடங்கவில்லை.

கிண்டிலின் வருகைக்குப் பிறகு இந்த சாதிப் பிரிவினை முற்றிலுமாகத் தமிழில் களையப்பட்டிருக்கிறது. யுனிகோட் மட்டும்தான். அதிலும் அவனே கொடுக்கும் ஏதோ ஒரு எழுத்துரு மட்டும்தான். நாம் எந்த யுனிகோட் எழுத்துருவில் எழுதியிருந்தாலும் பிரசுரமாகும்போது அது கிண்டிலில் உள்ள யுனிகோட் எழுத்துருவில்தான் காட்சியளிக்கும். ஆங்கிலத்தில் உள்ளது போல விதவிதமான எழுத்துருக்களைப் பயன்படுத்தும் சாத்தியங்கள் இல்லை. ஒருவேளை நாளை வரலாம். ஆனால் யுனிகோடில் மட்டுமே அது இருக்கும். பிற என்கோடிங்குகளுக்கு இனி வேலையில்லை.

இனி மின்நூல்களைத் தவிர்க்க இயலாது என்னும் சூழலில் பதிப்பகங்களும் எழுத்தாளர்களும் தமது வசம் இருக்கும் புத்தகப் பிரதிகளை யுனிகோடுக்கு மாற்றும்போது என்னென்ன விதமான சிக்கல்கள் வருகின்றன என்று சிறிது ஆராய்ந்தேன்.

1. ஸ்ரீலிபியில் இருந்து மத மாற்றம் செய்தால் ஆங்கிலச் சொற்கள் சேர்ந்து மாறாது. முழுப் புத்தகத்தையும் வரி வரியாகப் படித்து எங்கெல்லாம் ஆங்கிலச் சொற்கள் கசமுசவென்று மாறியிருக்கிறதோ, அவற்றை நீக்கிவிட்டு சரியான சொற்களை மீண்டும் டைப் செய்ய வேண்டும். முன்பு என்ன எழுதியிருந்தோம் என்று நினைவில்லாதிருந்தால் தீர்ந்தது. அச்சான பிரதியில் பக்கம் தேடி எடுத்து வைத்துக்கொண்டு சரி பார்க்க வேண்டும். ஓரிரு இடங்களில் சரி செய்யலாம். ஆயிரம் பக்கப் புத்தகமென்றால் என்ன செய்ய முடியும்?

2. பழைய பரணர் போன்ற டிஸ்கி/யுனிகோட் எழுத்துரு என்றால் வடமொழி எழுத்துகள் கலந்த சொற்கள் கண்டபடி உருப்பெருக்கும். உதாரணமாக எனது ஹிஸ்புல்லா புத்தகத்தை நான் இன்றுவரை கிண்டிலில் சேர்க்க இயலாதிருப்பதன் காரணம் ஒன்றுதான். TSCU Paranar-ல் எழுதப்பட்ட அப்புத்தகத்தை கிண்டில் வடிவத்துக்கு மாற்றுகையில் ஹிஸ்புல்லா என்னும் சொல் எங்கெல்லாம் வருகிறதோ அங்கெல்லாம் ‘ஹிஸ்புல்லாஹிஸ்புல்லா’ என்று இரட்டைக் கிளவியாகிவிடுகிறது. Global search / replace செய்தும் இதனை மாற்ற முடிவதில்லை. அப்படிச் செய்ய முற்பட்டால் இரண்டாவது ஹிஸ்புல்லாவின் இறுதித் துணையெழுத்து (லா-வில் உள்ள கால்) மட்டும் இரண்டு, மூன்று, நான்கு என்று இஷ்டத்துக்கு வருகிறது. இப்படி:- ஹிஸ்புல்லாாா.

3. Tab என்கோடிங்கில் உள்ள புத்தகத்தை யுனிகோடுக்கு மாற்றும்போது கொட்டேஷன்கள் வேண்டாத மாமியார், வேண்டாத மருமகள்களைப் போல இந்தப் பக்கமும் அந்தப் பக்கமுமாகத் திரும்பி நிற்கின்றன. (open quoteகள் close quote போலவும், close quoteகள் open quote போலவும்.)

4. Tamல் உள்ள பிரதிகளில் சிறிய ஹைஃபன்கள் சரியாக வருவதில்லை. அவை underscore ஆக மாறிவிடுகின்றன. அல்லது இந்திக்காரப் பிரதியைப் போல சில இடங்களில் எழுத்துக்கு மேலே பட்டையாகக் கோடு விழுகிறது. க்ஷ போன்ற வடமொழி எழுத்துகள் கண்ணராவியாக வருகின்றன. மொத்தப் பிரதியின் அளவு ஒன்றென்றால் இந்த எழுத்துகள் மட்டும் நடுவே நிறைமாத கர்ப்பிணி போல வயிற்றைத் தூக்கிகொண்டு எழுந்து நிற்கின்றன. பார்க்கச் சகிக்கவில்லை.

5. மேற்சொன்ன எந்த வரையறைக்குள்ளும் அடங்காத எழுத்துரு மாற்றக் குளறுபடிகளும் உண்டு. அவை ஏன் ஏற்படுகின்றன என்றே புரிவதில்லை. உதாரணமாக shree-tam 800என்னும் எழுத்துருவில் எழுதப்பட்ட எனது பாக். ஒரு புதிரின் சரிதம் புத்தகத்தை யுனிகோடுக்கு மாற்றினேன். இதில் அயூப் கான் என்று வருகிற அனைத்து இடங்களிலும் அயூபின் புள்ளி காணாமல் போயிருந்தது. மொத்தப் புத்தகமும் அயூப கான் என்றே இருந்தது. வேறு வழி? வரி வரியாகப் படித்துத் திருத்த வேண்டியதானது. (ஆனால் மற்ற சில shree tam புத்தகங்களில் இப்படி ஆகவில்லை. அதற்கும் காரணம் தெரியவில்லை.)

6. இதுவும் போக இன்னொரு சிக்கல், பிடிஎஃப் பிரதிகளை கூகுள் டிரைவில் ஏற்றி, கூகுள் டாக்கில் திறக்கும்போது வருகிற பிழைகள். இன்னதுதான் என்றே சொல்ல முடியாத பல நூதனப் பிரச்னைகள் அதில் வருகின்றன. முழுவதையும் எழுத்தெழுத்தாகப் படித்துப் பார்த்து சரி செய்வதற்கு பதில் புதிதாக டைப் செய்துவிடலாம் என்றே தோன்றிவிடுகிறது.

இதற்கெல்லாம் ஒரே தீர்வு ஒரு சிறந்த கன்வர்ட்டர் உருவாக்குவது அல்லது இருக்கும் கன்வர்ட்டர்களின் தரத்தை மேம்படுத்துவது என்பீர்களானால் பேச்சே இல்லை. அது இந்த ஜென்மத்தில் நடக்கப் போவதும் இல்லை.

இனி எழுதும் புத்தகங்களை, பதிப்பிக்கும் புத்தகங்களை யுனிகோடில் செய்வதுதான் எதிர்காலத்தில் இப்பிரச்னை நீடிக்காதிருக்க ஒரே வழி. அனைத்து விதமான எழுத்துருக்களுக்கும் ஒரு யுனிகோட் வர்ஷன் இதனால் அவசியமாகிறது. நிறுவனங்கள் இதனைச் செய்து விற்பனைக்குத் தர ஆரம்பிக்கலாம். இன்றுவரை யுனிகோடில் நமக்குக் கிடைக்கும் எழுத்துருக்கள் புத்தகப் பதிப்புக்கு ஏற்றதாக இல்லை. காரணம், அனைவருக்கும் இலவசமாகக் கிடைப்பதற்காகத் தன்னார்வலர்கள் உருவாக்கும் எழுத்துருக்கள் அவை. செய் நேர்த்தி போதாது. புத்தகப் பதிப்பில் பயன்படும் எழுத்துருக்களைப் போலவே சில யுனிகோட் எழுத்துருக்கள் இருக்கின்றன. ஆனாலும் அவ்வளவு துல்லியம் கிடையாது. Uni Ilasundaram 4, TAU_Ilango_Valluvar போன்ற மிகச் சில (அநேகமாக இந்த இரண்டு மட்டும்!) எழுத்துருக்கள் ஓரளவு அச்செழுத்துருக்களுக்குப் பக்கமாக வருபவை. இவற்றிலுமேகூட, தலைப்பு எழுத்துருக்கள் அவ்வளவு நன்றாக இராது.

மின்நூல் / அச்சுப் பதிப்பு இரண்டுமே இனி வரும் நாள்களில் அனைத்து எழுத்தாளர்களும் இங்கே நேரடியாகத் தயாரிக்கும் பொருள்களாக மாறிவிடும். (அல்லது ஆள் வைத்து அவரவர் புத்தகங்களை அவரவரே பதிப்பிப்பது.) பதிப்பகம் என்ற நடு நிறுவனத்தின் தேவை பெருமளவு குறையும். on demand printingதான் இனி நடைமுறையில் இருக்கும் (இப்போதே அப்படித்தான்.) அமேசான் போன்ற நிறுவனங்கள் (கூகுள் புக்ஸ், ஆப்பிள் புக்ஸும் விரைவில் இதில் சேரும்) தமிழுக்கும் இதனைக் கையில் எடுக்கும்போது எழுத்தாளர்கள் அச்சுப்பிரதி, மின்நூல் இரண்டையும் சொந்தமாக, முன் முதலீடின்றித் தயாரித்துக்கொள்ள முடியும். தேவைப்படும் பிரதிகளை மட்டும் சம்பந்தப்பட்ட தளத்தில் பணம் கொடுத்து வாங்கிக்கொள்ளலாம். அதை வெளியே கடைகளில் கொடுத்தோ, புத்தகக் காட்சியிலோ விற்கவும் செய்யலாம். (அமேசானில் இது இப்போதே ஆங்கிலத்தில் உண்டு.)

தமிழுக்கு அந்நாள் வரும்போது பிரதிகள் யுனிகோடில் தயாராக இல்லாவிட்டால் பின்தங்கிப் போக நேரிடும்.

எனவே, கையில் உள்ள பிரதிகளை முதலில் யுனிகோடில் மாற்றி வைத்துக்கொள்ளுங்கள். அச்சிடும் புத்தகங்களையும் யுனிகோடிலேயே அச்சிடுவதற்கு வழி பாருங்கள். இனி எழுதும் எதையும் அதிலேயே செய்யுங்கள். இல்லாவிட்டால் என்னைப் போல் முதுகு ஒடிய கன்வர்ஷனில் வேலை செய்து களைக்க வேண்டி வரும்.

Share

Discover more from Pa Raghavan

Subscribe to get the latest posts sent to your email.

By Para

தொகுப்பு

Random Posts

Recent Posts

Links

RSS Feeds

எழுத்துக் கல்வி

Subscribe via Email

Enter your email address to subscribe to this blog and receive notifications of new posts by email.

error: Content is protected !!

Discover more from Pa Raghavan

Subscribe now to keep reading and get access to the full archive.

Continue reading