పుట:అమ్మనుడి మార్చి 2021.pdf/12

వికీసోర్స్ నుండి
ఈ పుట అచ్చుదిద్దబడ్డది

యంత్రానువాదం

డా॥ ఎ. చంద్రశేఖరరావు 9949605141

వాక్య విశ్లేషణ - యంత్రానువాదం

భాషానిర్మాణం బహుక్షిష్టమైనది. మనుషులలో గుర్తింపగల భేదాలున్నట్లుగానే వారి భాషలోగూడ భేదాలుంటాయి. ఐతే ఇతను మనిషి అని గుర్తించగల సామాన్య లక్షణాలున్నట్లుగానే ఇది ఫలానా భాష అని గుర్తించడానికి ఆయాభాషలకు కొన్ని సామాన్య లక్షణాలుంటాయి. అవే వ్యాకరణాంశాలు. చెప్పేవాడిభాష వినేవాడిభాష ఒకటైతేనే పరస్పరం అర్థం చేసుకోగలరు. అంటే వారిద్దరికీ వారి వ్యవహార భాషలోని పద, పదాంశాల అర్థం, వాటి ప్రయోగం తెలిసుండాలి. కంప్యూటర్‌ ద్వారా వాక్యవిశ్లేషణ చేస్తున్నామంటే దానికి ముందుగానే ఒక భాష తెలిసుండాలి కదా. అది దాని భాషాకోశంలో వుంటుంది.

భాషాకోశ నిర్మాణం : భాషా వ్యవహర్త భాష ద్వారా భావాన్ని ఏవిధంగా అర్ధం చేసుకొంటున్నాడొ అదేవిధంగా యంత్రం భాషను అర్ధం చేసుకొంటుంది. వ్యవహర్త భాషను అర్థంచేసుకోవాలంటే ఆ భాషలోని పదాల అర్ధాలు, వాక్యనిర్మాణం, భాషా సంప్రదాయం తెలుసుకోవాలి. యంత్రానికి మాతృభాష వుండదు కాబట్టి మనం దానికి ఒక భాషను నేర్పాలి. భాషా విశ్లేషణం, పద, పదాంశాల ప్రయోగం గూడ నేర్పాలి. ఒక భాషలోని పద, పదాంశాలను గుర్తించాలంటే కంప్యూటరుకు ఆ భాష తెలిసుండాలి. అది దాని మూలభాష (source language) మూలభాషలోని పదాలకు సరైన అర్ధాన్నిచ్చే ఒక నిఘంటువు యంత్రానికి అందుబాటులో (Access) వుండాలి. ఒక పదానికి ఒకే అర్ధం ఉన్నట్లుగా నిఘంటువును తయారుచేసుకోవడం మంచిది. ఉదాహరణకి coming. come అన్న పదాలకు ఒకే అర్ధం వుంది. coming అన్న పదాన్ని కంప్యూటర్‌ com, ing, అంటూ విభజిస్తుంది. com అన్న పదం సాధారణ నిఘంటువులో వుండదు. అలాగే running అన్న మాటను తీసుకొంటే కంప్యూటర్‌ runn, ing. అంటూ విభజిస్తుంది. runn అన్న పదం నిఘంటువులో వుండదు. కాబట్టి యంత్రానువాదం కోసం ప్రత్యేకమైన నిఘంటువు తయారు చేసుకోవాలి. దానిలో ధాతువు, ప్రకృతి, ప్రత్యయాలు రాసి వుండాలి. come, com, run runn, ing కూడా వుండాలి. విశ్లేషణ ద్వారా వేరుచేయబడిన పదాల వర్గీకరణ చాల అవసరం. పదాలను భాషాభాగాలుగా వర్గీకరించడం మాత్రమే చాలదు. నామవాచకమైతే అది 1.జీవియా? నిర్జీవియా? జంతువా? వృక్షమా? ఆడా? మగా? మొదలైన వివరాలు వుండాలి. “ఇది కుక్క" అన్న వాక్యాన్ని విశ్లేషిస్తే వాక్యం = సర్వనామం (Ph) + నామం (N) అని కంప్యూటర్‌ గ్రహిస్తుంది. దీనిని తెరపై చూడగలం. కాని ఈ వాక్యం కంప్యూటర్‌ అర్ధం చేసుకొందా? “కుక్క” అన్న పదం నాచవాచకం అని దానికి తెలుసు. “ఇది” అన్నా “అది” అన్నా దానికి సర్వనామమే. కాబట్టీ వేరొక భాషలో అర్దం అడగాలి. పిల్లడు ఇంగ్లీషులో కథ చదువుతుంటే “అర్ధం అయిందా? అని అడుగుతాం కదా? “అయింది” అని వాడంటే “ఏదీ తెలుగులో (మాతృభాష) చెప్పు.” అంటాం కదా? విశ్లేషణే కాదు వెరిఫికేషన్‌ గూడ అవసరం. అనువాదం కోసం కంప్యూటరుకు అనేక భాషలు నేర్చవలసి వుంటుంది. మన ఆజ్జననునరించి కంప్యూటర్‌ మూలభాషను గ్రహిస్తుంది.

మూలభాషనే విశ్లేషిస్తుంది. నిఘంటువు ఆధారంగా మూలభాషా పదాలను లక్ష్యభాషలోకి (target language) అనువదించడం జరుగుతుంది.

యాంత్రిక విశ్లేషణ : కంప్యూటరు కీ బోర్డు ద్వారా విషయాన్ని అందిస్తున్నాం కాబట్టి, వ్రాతద్వారా వ్యక్తం చేసే భాష గురించి మాత్రమే ప్రస్తావించడం జరుగుతుంది. కంప్యూటర్‌కు అందించే భాష అన్వయ క్షిష్టత లేకుండా వుండాలి. అర్థ సందిగ్ధతకు తావులేనివిధంగా వుండాలి. వాక్యాలు దోషరహితంగా ఉండాలి. రాతలో ఐతే సాధారణంగా వ్యాకరణ దోషాలుండవు, కాని వాక్యంలో వాక్యం కలిసిపోయి వుంటే విశ్లేషణ కష్టమౌతుంది. అంతేగాదు పెద్దవాక్యాలలో దోషాలున్నాయో లేవో కూడ గుర్తించలేం. అందుచేత చిన్నచిన్న వాక్యాలు రాయడం మేలు.

విశ్లేషణ విధానం : విశ్లేషణలో ఒక్కొక్కరు ఒక్కొక్క విధానం అవలంభించవచ్చు. నాపద్ధతి- ముందుగా మూల భాషలోని వాక్యాన్ని గుర్తించడం. వాక్యం భాషలోని అర్ధయుక్తమైన కనిష్ట ప్రమాణం కాబట్టి వాక్యం పూర్తయిన తరవాత మాత్రమే భావాన్ని గ్రహించగలిగే వీలుంది. వ్రాతలో వాక్యాంతాన్ని (.) (?) (!) వంటి చిహ్నాల ద్వారా గుర్తించవచ్చు. అందుచేత కంప్యూటరుకు మేపే భాషలో విరామచిహ్నాలు వాడాలి. తరువాత భాషలోని వాక్యాన్ని విశ్లేషించుకోవాలి. అందుకోసం వాక్యంలోని పదాలను గుర్తించాలి. రాతలో పదాల మధ్య ఖాళీ ఉంచుతాం కాబట్టి, ఈ ఖాళీని ఆధారం చేసుకొని కంప్యూటర్‌ వాక్యంలోని ఒకొక్క పదాన్ని వేరుచేస్తుంది. మనం చదువుకొన్నట్లే కంప్యూటర్‌ కూడ అక్షరం అక్షరం చదువుకొంటూ పోతుంది. భాషలోని పదం నిఘంటువులో కనిపించిన వెంటనే దాని అర్ధాన్ని గ్రహించి రెండవ పదానికి పోతుంది. భారతీయ భాషలలో పదం ప్రత్యయంతో కూడి వుంటుంది. కాబట్టి ప్రకృతి ప్రత్యయ విభాగం చేయవలసి వుంటుంది. ఇంగ్లీషులో అయితే ప్రత్యయాలు (prepositions, post positions) నామవాచకంతో కలిసి వుండవు. ఆ భాషలో రెంటి మద్య ఖాళీ వుంటుంది. ఒక వాక్యాన్ని విడగొట్టి అందులోని పదాల అమరిక, పదాలలోని పదాంశాల అమరిక, వాటి మథ్య గల నంబంథం తెలుసుకోవచ్చు. పదాన్ని ప్రకృతి, ప్రత్యయ విభాగం చెయ్యకుండా మొత్తం పదం యొక్క అర్ధాన్ని గ్రహించాలనుకొంటే పెద్ద నిఘంటువును తయారు చేసుకోవాలి. ఏ భాషలోనైనా నామపదాలు,

తెలుగుజాతి పత్రిక అమ్మనుడి * మార్చి-2021

12