సహాయం:గూగుల్ ఒసిఆర్ వాడి అచ్చుదిద్దుటకు మెళకువలు

వికీసోర్స్ నుండి
గూగుల్ ఒసిఆర్ వాడి అచ్చుదిద్దటకు మెళకువలు

    16 డిసెంబర్ 2018 నాటి సందేశం ప్రకారం గూగుల్ ఒసిఆర్ ఇండిక్ ఒసిఆర్ అనే ఉపకరణం ద్వారా తెలుగువికీసోర్స్ లో నేరుగా వాడటానికి అందుబాటులో వచ్చింది. అంతకు ముందు , ప్రత్యేకంగా ఓసిఆర్ పాఠ్యాన్ని గూగుల్ నుండి సేకరించి బాట్ ద్వారా వికీసోర్స్లో ఎక్కించడం జరిగినా, వివిధ కారణాలవలన, మూల స్కాన్ నాణ్యతగా లేకపోవడం. గూగుల్ ఒసిఆర్ నాణ్యత తక్కువగా వుండడం వలన అంతగా ఉపయోగపడలేదు.

    2020 నాటికి గూగుల్ ఒసిఆర్ పనితీరు మరింత మెరుగయ్యింది. ఇండిక్ ఒసిఆర్ స్థానంలో గూగుల్ ఒసిఆర్ చేర్చబడింది. దానిని వాడకంలో ఆతరువాత అచ్చుదిద్దుటకు మెళకువలు ఈ పేజీలో సంగ్రహిస్తున్నాము. దీనికి సంబంధించిన అంశాలు చేర్చండి లేక చర్చా పేజీలో చర్చించండి.

    1. గతంలో OCR పాఠ్యం కన్నా ప్రస్తుత గూగుల్ OCR మెరుగుగా వున్నందున మరల గూగుల్ ఒసిఆర్ చేసి అచ్చుదిద్దడం మంచిది.
    2. ప్రస్తుత గూగుల్ OCR పుస్తకపు వరుసలను చాలావరకు గుర్తిస్తున్నది. అచ్చు సరిచూసుటకు ఇది చాలా ఉపయోగంగా వుంది.
      1. పేజీ చివర పదం విడిపోతే పదం విరుపు దగ్గర -(hyphen) చేర్చితే ప్రధానపేరుబరిలో పదం విరుపు తొలగుతుంది.
      2. పేజీలో వరుస చివరి పదం విరుపుకు గురైతే వికీసోర్స్ పేరాలో ఖాళీ వచ్చి చేరుతున్నందున, అటువంటి చోట్ల తరువాతి వరుసను కలిపితేనే మంచిది.
    3. కొన్ని పుస్తకాలలో వాడిన ఖతులను ఒసిఆర్ చేసేటపుడు సంయుక్తాక్షరాల తరవాత తరువాత ఒక ఖాళీ చేర్చడం లాంటివి చేరుస్తున్నది. అవి తొలగించాలి.
    4. కొన్ని సార్లు గూగుల్ ఓసిఆర్ ఎందుకో పేరాలలో వరుస చివరను సరిగా గుర్తించక చివరి పదాలను విడదీసి పేజీ చివరలో వేరువరసలలో చేరుస్తున్నది. (https://te.wikisource.org/w/index.php?title=%E0%B0%AA%E0%B1%81%E0%B0%9F:TELUGU-NAVALA.pdf/40&diff=prev&oldid=333859 తేడాలో ’ఎంతగానో ఆకర్షించింది’ అని చివరలో వున్న వరుసను మానవీయంగా సవరించడం చూడండి).

    ఇవీ చూడండి[మార్చు]