భారతీయ AI రంగంలో విప్లవం: ‘సర్వం అక్షర్’తో డాక్యుమెంట్ ఇంటెలిజెన్స్ సరికొత్త పుంతలు

సర్వం AI తన కొత్త టూల్ 'సర్వం అక్షర్'ను విడుదల చేసింది. ఇది భారతీయ భాషల్లో గూగుల్ జెమిని, GPT-5 కంటే మెరుగ్గా పనిచేస్తుంది.

━━━━━━━━━━━━━━━━━━━━━━━

📌 ముఖ్యాంశాలు :

• సర్వం AI తన సరికొత్త డాక్యుమెంట్ ఇంటెలిజెన్స్ టూల్ ‘అక్షర్’ను విడుదల చేసింది.

• ఇది ఇంగ్లీష్‌తో పాటు 22 భారతీయ భాషల్లో అత్యంత ఖచ్చితత్వంతో పనిచేస్తుంది.

• గూగుల్ జెమిని, GPT-5 వంటి గ్లోబల్ మోడళ్లను ఇండిక్ లాంగ్వేజ్ బెంచ్‌మార్క్‌లలో అధిగమించింది.

• పాతకాలపు పత్రాలు, క్లిష్టమైన లేఅవుట్‌లను కూడా సులభంగా డిజిటలైజ్ చేస్తుంది.

━━━━━━━━━━━━━━━━━━━━━━━

సర్వం అక్షర్ AI టూల్ క్లిష్టమైన భారతీయ భాషా పత్రాలను విశ్లేషిస్తున్న దృశ్యం.

భారతదేశం వంటి బహుభాషా దేశంలో డిజిటలైజేషన్ అనేది అతిపెద్ద సవాలు. ముఖ్యంగా ప్రభుత్వ రికార్డులు, చారిత్రక పత్రాలు మరియు క్లిష్టమైన డాక్యుమెంట్లను స్కాన్ చేసి టెక్స్ట్‌గా మార్చడంలో పాతకాలపు టెక్నాలజీ (OCR) విఫలమవుతోంది. ఈ సమస్యకు పరిష్కారంగా, ప్రముఖ భారతీయ AI స్టార్టప్ ‘సర్వం AI’ తాజాగా సర్వం అక్షర్ (Sarvam Akshar) అనే వినూత్న టూల్‌ను పరిచయం చేసింది. ఇది ఫిబ్రవరి 15, 2026న అధికారికంగా విడుదలైంది. సర్వం విజన్ (Sarvam Vision) అనే శక్తివంతమైన మోడల్ ఆధారంగా రూపొందించబడిన ఈ టూల్, డాక్యుమెంట్ల నుంచి సమాచారాన్ని సేకరించడమే కాకుండా, వాటిని లోతుగా విశ్లేషించగలదు.

సర్వం విజన్ అనేది 3 బిలియన్ పారామీటర్లతో కూడిన అత్యాధునిక విజన్-లాంగ్వేజ్ మోడల్. ఇది ఇంగ్లీష్ మరియు 22 భారతీయ భాషల్లో డాక్యుమెంట్ ఇంటెలిజెన్స్ కోసం ప్రత్యేకంగా రూపొందించబడింది. ఆశ్చర్యకరమైన విషయం ఏమిటంటే, ఈ మోడల్ గ్లోబల్ బెంచ్‌మార్క్‌లైన olmOCR-Bench మరియు OmniDocBench లలో ఇంగ్లీష్ విభాగంలో టాప్ స్కోర్‌లను సాధించింది. అంతేకాకుండా, భారతీయ భాషల విషయానికి వస్తే, ‘సర్వం ఇండిక్ OCR బెంచ్’లో Gemini 3 Pro, Opus 4.5 మరియు GPT-5.2 వంటి అంతర్జాతీయ దిగ్గజ మోడళ్లను కూడా అధిగమించి అత్యుత్తమ ఖచ్చితత్వాన్ని నమోదు చేసింది.

ప్రస్తుతం మార్కెట్లో ఉన్న పాత OCR (Optical Character Recognition) వ్యవస్థలు, అంటే టెస్సెరాక్ట్ (Tesseract) లేదా గూగుల్ క్లౌడ్ విజన్ వంటివి, అన్-స్ట్రక్చర్డ్ డాక్యుమెంట్లను ప్రాసెస్ చేసేటప్పుడు తీవ్రమైన ఇబ్బందులను ఎదుర్కొంటాయి. ఇవి అక్షరాలను విడివిడిగా గుర్తిస్తాయి కానీ, ఆ పేజీ యొక్క సందర్భాన్ని లేదా లేఅవుట్‌ను అర్థం చేసుకోలేవు. ఉదాహరణకు, ఒక పేజీలో రెండు మూడు కాలమ్స్ ఉంటే, పాత సిస్టమ్‌లు వాటిని వరుసగా చదివేస్తాయి, దీనివల్ల సమాచారం తారుమారవుతుంది. ముఖ్యంగా భారతీయ భాషల్లోని ఒత్తులు, దీర్ఘాలు (Matras) వంటి వాటిని గుర్తించడంలో ఇవి తరచుగా తప్పులు చేస్తుంటాయి.

మరోవైపు, అధునాతన మల్టీమోడల్ మోడల్స్ (VLMs) కొంతవరకు మెరుగ్గా పనిచేస్తున్నప్పటికీ, సంక్లిష్టమైన పత్రాల దగ్గరకు వచ్చేసరికి అవి కూడా తడబడుతున్నాయి. పాత కాలపు వార్తాపత్రికలు, గ్రాఫ్‌లు ఉన్న మ్యాగజైన్లు లేదా చారిత్రక పత్రాలను ప్రాసెస్ చేసేటప్పుడు ఇవి తప్పుడు సమాచారాన్ని (Hallucinations) సృష్టిస్తున్నాయి. ఈ గ్యాప్‌ను భర్తీ చేయడానికే సర్వం AI ‘అక్షర్’ను తీసుకొచ్చింది. ఇది కేవలం టెక్స్ట్‌ను వెలికితీయడమే కాకుండా, ఆ టెక్స్ట్ పేజీలో ఎక్కడ ఉంది (Visual Grounding), దాని లేఅవుట్ ఎలా ఉంది అనే అంశాలను విశ్లేషించి ఆటోమేటెడ్ ప్రూఫ్ రీడింగ్‌ను కూడా చేస్తుంది.

🚀 Subscribe to Ramthamedia WhatsApp & Telegram Channels for News, Articles, Reviews & Books!
రామ్తామీడియా లేటెస్ట్ వార్తలు, ప్రత్యేక కథనాలు మీ ఫోన్లో అందుకోవడానికి ఇప్పుడే సబ్‌స్క్రైబ్ చేసుకోండి.

1800వ కాలం నాటి పాత గుజరాతీ లేదా తమిళ రాతప్రతులను డిజిటలైజ్ చేయడాన్ని ఒక ఉదాహరణగా తీసుకుంటే, సాధారణ AI మోడళ్లు వాటిలోని పాత అక్షరాలను ఇప్పటి కాలపు స్పెల్లింగ్‌లుగా తప్పుగా మారుస్తాయి. దీనివల్ల ఒక భాషా నిపుణుడు కూర్చుని ప్రతి లైన్‌ను సరిచూడాల్సి ఉంటుంది. ఇది చాలా సమయం తీసుకునే ప్రక్రియ. కానీ ‘అక్షర్’ టూల్ తన ఏజెంట్ లూప్ ద్వారా ఎక్కడైతే అక్షరాలపై సందేహం ఉందో వాటిని ముందే గుర్తిస్తుంది. దీనివల్ల ఒక నిపుణుడు గంటల తరబడి చేసే పనిని కేవలం కొద్ది నిమిషాల్లోనే పూర్తి చేయవచ్చు.

తెలంగాణ ప్రభుత్వం మరియు కేంద్ర ప్రభుత్వ సంస్థలు తమ పాత రికార్డులను భద్రపరచడానికి, డిజిటలైజ్ చేయడానికి ఇలాంటి స్వదేశీ సాంకేతికతను ఉపయోగించుకోవడం ద్వారా అద్భుతమైన ఫలితాలను సాధించవచ్చు. డిజిటల్ ఇండియా మిషన్‌లో భాగంగా ప్రతి సామాన్యుడికి వారి సొంత భాషలో సమాచారం అందాలంటే, ఇలాంటి టూల్స్ అత్యంత కీలకం. RBI వంటి సంస్థలు కూడా తమ వద్ద ఉన్న భారీ డాక్యుమెంట్లను డేటాగా మార్చడానికి ‘అక్షర్’ వంటి టూల్స్‌ను వినియోగించుకునే అవకాశం ఉంది. భవిష్యత్తులో భారతీయ భాషా విజ్ఞానాన్ని భద్రపరచడంలో సర్వం AI ఒక మైలురాయిగా నిలుస్తుందని చెప్పడంలో ఎలాంటి సందేహం లేదు.

అధికారిక సమాచారం కోసం ఈ వనరులు చూడండి:

Sarvam AI Official Blog – https://www.sarvam.ai/blog

India AI Mission – https://indiaai.gov.in

Ministry of Electronics and IT – https://www.meity.gov.in

అత్యంత ఖచ్చితమైన సమాచారం కోసం పై అధికారిక వనరులను సందర్శించండి.

గమనిక: ఈ కథనం అధికారిక సమాచారం మరియు ప్రజా వనరుల ఆధారంగా రూపొందించబడింది. పూర్తి వివరాల కోసం అధికారిక వెబ్‌సైట్లను పరిశీలించాలి.

Leave a Reply

Your email address will not be published. Required fields are marked *