━━━━━━━━━━━━━━━━━━━━━━━
📌 ముఖ్యాంశాలు :
• సర్వం AI తన సరికొత్త డాక్యుమెంట్ ఇంటెలిజెన్స్ టూల్ ‘అక్షర్’ను విడుదల చేసింది.
• ఇది ఇంగ్లీష్తో పాటు 22 భారతీయ భాషల్లో అత్యంత ఖచ్చితత్వంతో పనిచేస్తుంది.
• గూగుల్ జెమిని, GPT-5 వంటి గ్లోబల్ మోడళ్లను ఇండిక్ లాంగ్వేజ్ బెంచ్మార్క్లలో అధిగమించింది.
• పాతకాలపు పత్రాలు, క్లిష్టమైన లేఅవుట్లను కూడా సులభంగా డిజిటలైజ్ చేస్తుంది.
━━━━━━━━━━━━━━━━━━━━━━━
భారతదేశం వంటి బహుభాషా దేశంలో డిజిటలైజేషన్ అనేది అతిపెద్ద సవాలు. ముఖ్యంగా ప్రభుత్వ రికార్డులు, చారిత్రక పత్రాలు మరియు క్లిష్టమైన డాక్యుమెంట్లను స్కాన్ చేసి టెక్స్ట్గా మార్చడంలో పాతకాలపు టెక్నాలజీ (OCR) విఫలమవుతోంది. ఈ సమస్యకు పరిష్కారంగా, ప్రముఖ భారతీయ AI స్టార్టప్ ‘సర్వం AI’ తాజాగా సర్వం అక్షర్ (Sarvam Akshar) అనే వినూత్న టూల్ను పరిచయం చేసింది. ఇది ఫిబ్రవరి 15, 2026న అధికారికంగా విడుదలైంది. సర్వం విజన్ (Sarvam Vision) అనే శక్తివంతమైన మోడల్ ఆధారంగా రూపొందించబడిన ఈ టూల్, డాక్యుమెంట్ల నుంచి సమాచారాన్ని సేకరించడమే కాకుండా, వాటిని లోతుగా విశ్లేషించగలదు.
సర్వం విజన్ అనేది 3 బిలియన్ పారామీటర్లతో కూడిన అత్యాధునిక విజన్-లాంగ్వేజ్ మోడల్. ఇది ఇంగ్లీష్ మరియు 22 భారతీయ భాషల్లో డాక్యుమెంట్ ఇంటెలిజెన్స్ కోసం ప్రత్యేకంగా రూపొందించబడింది. ఆశ్చర్యకరమైన విషయం ఏమిటంటే, ఈ మోడల్ గ్లోబల్ బెంచ్మార్క్లైన olmOCR-Bench మరియు OmniDocBench లలో ఇంగ్లీష్ విభాగంలో టాప్ స్కోర్లను సాధించింది. అంతేకాకుండా, భారతీయ భాషల విషయానికి వస్తే, ‘సర్వం ఇండిక్ OCR బెంచ్’లో Gemini 3 Pro, Opus 4.5 మరియు GPT-5.2 వంటి అంతర్జాతీయ దిగ్గజ మోడళ్లను కూడా అధిగమించి అత్యుత్తమ ఖచ్చితత్వాన్ని నమోదు చేసింది.
ప్రస్తుతం మార్కెట్లో ఉన్న పాత OCR (Optical Character Recognition) వ్యవస్థలు, అంటే టెస్సెరాక్ట్ (Tesseract) లేదా గూగుల్ క్లౌడ్ విజన్ వంటివి, అన్-స్ట్రక్చర్డ్ డాక్యుమెంట్లను ప్రాసెస్ చేసేటప్పుడు తీవ్రమైన ఇబ్బందులను ఎదుర్కొంటాయి. ఇవి అక్షరాలను విడివిడిగా గుర్తిస్తాయి కానీ, ఆ పేజీ యొక్క సందర్భాన్ని లేదా లేఅవుట్ను అర్థం చేసుకోలేవు. ఉదాహరణకు, ఒక పేజీలో రెండు మూడు కాలమ్స్ ఉంటే, పాత సిస్టమ్లు వాటిని వరుసగా చదివేస్తాయి, దీనివల్ల సమాచారం తారుమారవుతుంది. ముఖ్యంగా భారతీయ భాషల్లోని ఒత్తులు, దీర్ఘాలు (Matras) వంటి వాటిని గుర్తించడంలో ఇవి తరచుగా తప్పులు చేస్తుంటాయి.
మరోవైపు, అధునాతన మల్టీమోడల్ మోడల్స్ (VLMs) కొంతవరకు మెరుగ్గా పనిచేస్తున్నప్పటికీ, సంక్లిష్టమైన పత్రాల దగ్గరకు వచ్చేసరికి అవి కూడా తడబడుతున్నాయి. పాత కాలపు వార్తాపత్రికలు, గ్రాఫ్లు ఉన్న మ్యాగజైన్లు లేదా చారిత్రక పత్రాలను ప్రాసెస్ చేసేటప్పుడు ఇవి తప్పుడు సమాచారాన్ని (Hallucinations) సృష్టిస్తున్నాయి. ఈ గ్యాప్ను భర్తీ చేయడానికే సర్వం AI ‘అక్షర్’ను తీసుకొచ్చింది. ఇది కేవలం టెక్స్ట్ను వెలికితీయడమే కాకుండా, ఆ టెక్స్ట్ పేజీలో ఎక్కడ ఉంది (Visual Grounding), దాని లేఅవుట్ ఎలా ఉంది అనే అంశాలను విశ్లేషించి ఆటోమేటెడ్ ప్రూఫ్ రీడింగ్ను కూడా చేస్తుంది.
1800వ కాలం నాటి పాత గుజరాతీ లేదా తమిళ రాతప్రతులను డిజిటలైజ్ చేయడాన్ని ఒక ఉదాహరణగా తీసుకుంటే, సాధారణ AI మోడళ్లు వాటిలోని పాత అక్షరాలను ఇప్పటి కాలపు స్పెల్లింగ్లుగా తప్పుగా మారుస్తాయి. దీనివల్ల ఒక భాషా నిపుణుడు కూర్చుని ప్రతి లైన్ను సరిచూడాల్సి ఉంటుంది. ఇది చాలా సమయం తీసుకునే ప్రక్రియ. కానీ ‘అక్షర్’ టూల్ తన ఏజెంట్ లూప్ ద్వారా ఎక్కడైతే అక్షరాలపై సందేహం ఉందో వాటిని ముందే గుర్తిస్తుంది. దీనివల్ల ఒక నిపుణుడు గంటల తరబడి చేసే పనిని కేవలం కొద్ది నిమిషాల్లోనే పూర్తి చేయవచ్చు.
తెలంగాణ ప్రభుత్వం మరియు కేంద్ర ప్రభుత్వ సంస్థలు తమ పాత రికార్డులను భద్రపరచడానికి, డిజిటలైజ్ చేయడానికి ఇలాంటి స్వదేశీ సాంకేతికతను ఉపయోగించుకోవడం ద్వారా అద్భుతమైన ఫలితాలను సాధించవచ్చు. డిజిటల్ ఇండియా మిషన్లో భాగంగా ప్రతి సామాన్యుడికి వారి సొంత భాషలో సమాచారం అందాలంటే, ఇలాంటి టూల్స్ అత్యంత కీలకం. RBI వంటి సంస్థలు కూడా తమ వద్ద ఉన్న భారీ డాక్యుమెంట్లను డేటాగా మార్చడానికి ‘అక్షర్’ వంటి టూల్స్ను వినియోగించుకునే అవకాశం ఉంది. భవిష్యత్తులో భారతీయ భాషా విజ్ఞానాన్ని భద్రపరచడంలో సర్వం AI ఒక మైలురాయిగా నిలుస్తుందని చెప్పడంలో ఎలాంటి సందేహం లేదు.
అధికారిక సమాచారం కోసం ఈ వనరులు చూడండి:
Sarvam AI Official Blog – https://www.sarvam.ai/blog
India AI Mission – https://indiaai.gov.in
Ministry of Electronics and IT – https://www.meity.gov.in
అత్యంత ఖచ్చితమైన సమాచారం కోసం పై అధికారిక వనరులను సందర్శించండి.
గమనిక: ఈ కథనం అధికారిక సమాచారం మరియు ప్రజా వనరుల ఆధారంగా రూపొందించబడింది. పూర్తి వివరాల కోసం అధికారిక వెబ్సైట్లను పరిశీలించాలి.