Sarvam Akshar AI: సర్వం అక్షర్ - ఇండిక్ భాషల డిజిటలైజేషన్‌

━━━━━━━━━━━━━━━━━━━━━━━

📌 ముఖ్యాంశాలు :

• సర్వం AI తన సరికొత్త డాక్యుమెంట్ ఇంటెలిజెన్స్ టూల్ ‘అక్షర్’ను విడుదల చేసింది.

• ఇది ఇంగ్లీష్‌తో పాటు 22 భారతీయ భాషల్లో అత్యంత ఖచ్చితత్వంతో పనిచేస్తుంది.

• గూగుల్ జెమిని, GPT-5 వంటి గ్లోబల్ మోడళ్లను ఇండిక్ లాంగ్వేజ్ బెంచ్‌మార్క్‌లలో అధిగమించింది.

• పాతకాలపు పత్రాలు, క్లిష్టమైన లేఅవుట్‌లను కూడా సులభంగా డిజిటలైజ్ చేస్తుంది.

━━━━━━━━━━━━━━━━━━━━━━━

సర్వం అక్షర్ AI టూల్ క్లిష్టమైన భారతీయ భాషా పత్రాలను విశ్లేషిస్తున్న దృశ్యం.

భారతదేశం వంటి బహుభాషా దేశంలో డిజిటలైజేషన్ అనేది అతిపెద్ద సవాలు. ముఖ్యంగా ప్రభుత్వ రికార్డులు, చారిత్రక పత్రాలు మరియు క్లిష్టమైన డాక్యుమెంట్లను స్కాన్ చేసి టెక్స్ట్‌గా మార్చడంలో పాతకాలపు టెక్నాలజీ (OCR) విఫలమవుతోంది. ఈ సమస్యకు పరిష్కారంగా, ప్రముఖ భారతీయ AI స్టార్టప్ ‘సర్వం AI’ తాజాగా సర్వం అక్షర్ (Sarvam Akshar) అనే వినూత్న టూల్‌ను పరిచయం చేసింది. ఇది ఫిబ్రవరి 15, 2026న అధికారికంగా విడుదలైంది. సర్వం విజన్ (Sarvam Vision) అనే శక్తివంతమైన మోడల్ ఆధారంగా రూపొందించబడిన ఈ టూల్, డాక్యుమెంట్ల నుంచి సమాచారాన్ని సేకరించడమే కాకుండా, వాటిని లోతుగా విశ్లేషించగలదు.

సర్వం విజన్ అనేది 3 బిలియన్ పారామీటర్లతో కూడిన అత్యాధునిక విజన్-లాంగ్వేజ్ మోడల్. ఇది ఇంగ్లీష్ మరియు 22 భారతీయ భాషల్లో డాక్యుమెంట్ ఇంటెలిజెన్స్ కోసం ప్రత్యేకంగా రూపొందించబడింది. ఆశ్చర్యకరమైన విషయం ఏమిటంటే, ఈ మోడల్ గ్లోబల్ బెంచ్‌మార్క్‌లైన olmOCR-Bench మరియు OmniDocBench లలో ఇంగ్లీష్ విభాగంలో టాప్ స్కోర్‌లను సాధించింది. అంతేకాకుండా, భారతీయ భాషల విషయానికి వస్తే, ‘సర్వం ఇండిక్ OCR బెంచ్’లో Gemini 3 Pro, Opus 4.5 మరియు GPT-5.2 వంటి అంతర్జాతీయ దిగ్గజ మోడళ్లను కూడా అధిగమించి అత్యుత్తమ ఖచ్చితత్వాన్ని నమోదు చేసింది.

ప్రస్తుతం మార్కెట్లో ఉన్న పాత OCR (Optical Character Recognition) వ్యవస్థలు, అంటే టెస్సెరాక్ట్ (Tesseract) లేదా గూగుల్ క్లౌడ్ విజన్ వంటివి, అన్-స్ట్రక్చర్డ్ డాక్యుమెంట్లను ప్రాసెస్ చేసేటప్పుడు తీవ్రమైన ఇబ్బందులను ఎదుర్కొంటాయి. ఇవి అక్షరాలను విడివిడిగా గుర్తిస్తాయి కానీ, ఆ పేజీ యొక్క సందర్భాన్ని లేదా లేఅవుట్‌ను అర్థం చేసుకోలేవు. ఉదాహరణకు, ఒక పేజీలో రెండు మూడు కాలమ్స్ ఉంటే, పాత సిస్టమ్‌లు వాటిని వరుసగా చదివేస్తాయి, దీనివల్ల సమాచారం తారుమారవుతుంది. ముఖ్యంగా భారతీయ భాషల్లోని ఒత్తులు, దీర్ఘాలు (Matras) వంటి వాటిని గుర్తించడంలో ఇవి తరచుగా తప్పులు చేస్తుంటాయి.

మరోవైపు, అధునాతన మల్టీమోడల్ మోడల్స్ (VLMs) కొంతవరకు మెరుగ్గా పనిచేస్తున్నప్పటికీ, సంక్లిష్టమైన పత్రాల దగ్గరకు వచ్చేసరికి అవి కూడా తడబడుతున్నాయి. పాత కాలపు వార్తాపత్రికలు, గ్రాఫ్‌లు ఉన్న మ్యాగజైన్లు లేదా చారిత్రక పత్రాలను ప్రాసెస్ చేసేటప్పుడు ఇవి తప్పుడు సమాచారాన్ని (Hallucinations) సృష్టిస్తున్నాయి. ఈ గ్యాప్‌ను భర్తీ చేయడానికే సర్వం AI ‘అక్షర్’ను తీసుకొచ్చింది. ఇది కేవలం టెక్స్ట్‌ను వెలికితీయడమే కాకుండా, ఆ టెక్స్ట్ పేజీలో ఎక్కడ ఉంది (Visual Grounding), దాని లేఅవుట్ ఎలా ఉంది అనే అంశాలను విశ్లేషించి ఆటోమేటెడ్ ప్రూఫ్ రీడింగ్‌ను కూడా చేస్తుంది.

🚀 Subscribe to Ramthamedia WhatsApp & Telegram Channels for News, Articles, Reviews & Books!

రామ్తామీడియా లేటెస్ట్ వార్తలు, ప్రత్యేక కథనాలు మీ ఫోన్లో అందుకోవడానికి ఇప్పుడే సబ్‌స్క్రైబ్ చేసుకోండి.

WhatsApp Channel

Telegram Channel

1800వ కాలం నాటి పాత గుజరాతీ లేదా తమిళ రాతప్రతులను డిజిటలైజ్ చేయడాన్ని ఒక ఉదాహరణగా తీసుకుంటే, సాధారణ AI మోడళ్లు వాటిలోని పాత అక్షరాలను ఇప్పటి కాలపు స్పెల్లింగ్‌లుగా తప్పుగా మారుస్తాయి. దీనివల్ల ఒక భాషా నిపుణుడు కూర్చుని ప్రతి లైన్‌ను సరిచూడాల్సి ఉంటుంది. ఇది చాలా సమయం తీసుకునే ప్రక్రియ. కానీ ‘అక్షర్’ టూల్ తన ఏజెంట్ లూప్ ద్వారా ఎక్కడైతే అక్షరాలపై సందేహం ఉందో వాటిని ముందే గుర్తిస్తుంది. దీనివల్ల ఒక నిపుణుడు గంటల తరబడి చేసే పనిని కేవలం కొద్ది నిమిషాల్లోనే పూర్తి చేయవచ్చు.

తెలంగాణ ప్రభుత్వం మరియు కేంద్ర ప్రభుత్వ సంస్థలు తమ పాత రికార్డులను భద్రపరచడానికి, డిజిటలైజ్ చేయడానికి ఇలాంటి స్వదేశీ సాంకేతికతను ఉపయోగించుకోవడం ద్వారా అద్భుతమైన ఫలితాలను సాధించవచ్చు. డిజిటల్ ఇండియా మిషన్‌లో భాగంగా ప్రతి సామాన్యుడికి వారి సొంత భాషలో సమాచారం అందాలంటే, ఇలాంటి టూల్స్ అత్యంత కీలకం. RBI వంటి సంస్థలు కూడా తమ వద్ద ఉన్న భారీ డాక్యుమెంట్లను డేటాగా మార్చడానికి ‘అక్షర్’ వంటి టూల్స్‌ను వినియోగించుకునే అవకాశం ఉంది. భవిష్యత్తులో భారతీయ భాషా విజ్ఞానాన్ని భద్రపరచడంలో సర్వం AI ఒక మైలురాయిగా నిలుస్తుందని చెప్పడంలో ఎలాంటి సందేహం లేదు.

అధికారిక సమాచారం కోసం ఈ వనరులు చూడండి:

Sarvam AI Official Blog – https://www.sarvam.ai/blog

India AI Mission – https://indiaai.gov.in

Ministry of Electronics and IT – https://www.meity.gov.in

అత్యంత ఖచ్చితమైన సమాచారం కోసం పై అధికారిక వనరులను సందర్శించండి.

గమనిక: ఈ కథనం అధికారిక సమాచారం మరియు ప్రజా వనరుల ఆధారంగా రూపొందించబడింది. పూర్తి వివరాల కోసం అధికారిక వెబ్‌సైట్లను పరిశీలించాలి.

భారతీయ AI రంగంలో విప్లవం: ‘సర్వం అక్షర్’తో డాక్యుమెంట్ ఇంటెలిజెన్స్ సరికొత్త పుంతలు

Leave a ReplyCancel Reply

ఇవి కూడా చదవండి:

Leave a ReplyCancel Reply