భారతీయ AI రంగంలో విప్లవం: ‘సర్వం అక్షర్’తో డాక్యుమెంట్ ఇంటెలిజెన్స్ సరికొత్త పుంతలు

సర్వం AI తన కొత్త టూల్ 'సర్వం అక్షర్'ను విడుదల చేసింది. ఇది భారతీయ భాషల్లో గూగుల్ జెమిని, GPT-5 కంటే మెరుగ్గా పనిచేస్తుంది.

━━━━━━━━━━━━━━━━━━━━━━━

📌 ముఖ్యాంశాలు :

• సర్వం AI తన సరికొత్త డాక్యుమెంట్ ఇంటెలిజెన్స్ టూల్ ‘అక్షర్’ను విడుదల చేసింది.

• ఇది ఇంగ్లీష్‌తో పాటు 22 భారతీయ భాషల్లో అత్యంత ఖచ్చితత్వంతో పనిచేస్తుంది.

• గూగుల్ జెమిని, GPT-5 వంటి గ్లోబల్ మోడళ్లను ఇండిక్ లాంగ్వేజ్ బెంచ్‌మార్క్‌లలో అధిగమించింది.

• పాతకాలపు పత్రాలు, క్లిష్టమైన లేఅవుట్‌లను కూడా సులభంగా డిజిటలైజ్ చేస్తుంది.

━━━━━━━━━━━━━━━━━━━━━━━

సర్వం అక్షర్ AI టూల్ క్లిష్టమైన భారతీయ భాషా పత్రాలను విశ్లేషిస్తున్న దృశ్యం.

భారతదేశం వంటి బహుభాషా దేశంలో డిజిటలైజేషన్ అనేది అతిపెద్ద సవాలు. ముఖ్యంగా ప్రభుత్వ రికార్డులు, చారిత్రక పత్రాలు మరియు క్లిష్టమైన డాక్యుమెంట్లను స్కాన్ చేసి టెక్స్ట్‌గా మార్చడంలో పాతకాలపు టెక్నాలజీ (OCR) విఫలమవుతోంది. ఈ సమస్యకు పరిష్కారంగా, ప్రముఖ భారతీయ AI స్టార్టప్ ‘సర్వం AI’ తాజాగా సర్వం అక్షర్ (Sarvam Akshar) అనే వినూత్న టూల్‌ను పరిచయం చేసింది. ఇది ఫిబ్రవరి 15, 2026న అధికారికంగా విడుదలైంది. సర్వం విజన్ (Sarvam Vision) అనే శక్తివంతమైన మోడల్ ఆధారంగా రూపొందించబడిన ఈ టూల్, డాక్యుమెంట్ల నుంచి సమాచారాన్ని సేకరించడమే కాకుండా, వాటిని లోతుగా విశ్లేషించగలదు.

సర్వం విజన్ అనేది 3 బిలియన్ పారామీటర్లతో కూడిన అత్యాధునిక విజన్-లాంగ్వేజ్ మోడల్. ఇది ఇంగ్లీష్ మరియు 22 భారతీయ భాషల్లో డాక్యుమెంట్ ఇంటెలిజెన్స్ కోసం ప్రత్యేకంగా రూపొందించబడింది. ఆశ్చర్యకరమైన విషయం ఏమిటంటే, ఈ మోడల్ గ్లోబల్ బెంచ్‌మార్క్‌లైన olmOCR-Bench మరియు OmniDocBench లలో ఇంగ్లీష్ విభాగంలో టాప్ స్కోర్‌లను సాధించింది. అంతేకాకుండా, భారతీయ భాషల విషయానికి వస్తే, ‘సర్వం ఇండిక్ OCR బెంచ్’లో Gemini 3 Pro, Opus 4.5 మరియు GPT-5.2 వంటి అంతర్జాతీయ దిగ్గజ మోడళ్లను కూడా అధిగమించి అత్యుత్తమ ఖచ్చితత్వాన్ని నమోదు చేసింది.

ప్రస్తుతం మార్కెట్లో ఉన్న పాత OCR (Optical Character Recognition) వ్యవస్థలు, అంటే టెస్సెరాక్ట్ (Tesseract) లేదా గూగుల్ క్లౌడ్ విజన్ వంటివి, అన్-స్ట్రక్చర్డ్ డాక్యుమెంట్లను ప్రాసెస్ చేసేటప్పుడు తీవ్రమైన ఇబ్బందులను ఎదుర్కొంటాయి. ఇవి అక్షరాలను విడివిడిగా గుర్తిస్తాయి కానీ, ఆ పేజీ యొక్క సందర్భాన్ని లేదా లేఅవుట్‌ను అర్థం చేసుకోలేవు. ఉదాహరణకు, ఒక పేజీలో రెండు మూడు కాలమ్స్ ఉంటే, పాత సిస్టమ్‌లు వాటిని వరుసగా చదివేస్తాయి, దీనివల్ల సమాచారం తారుమారవుతుంది. ముఖ్యంగా భారతీయ భాషల్లోని ఒత్తులు, దీర్ఘాలు (Matras) వంటి వాటిని గుర్తించడంలో ఇవి తరచుగా తప్పులు చేస్తుంటాయి.

మరోవైపు, అధునాతన మల్టీమోడల్ మోడల్స్ (VLMs) కొంతవరకు మెరుగ్గా పనిచేస్తున్నప్పటికీ, సంక్లిష్టమైన పత్రాల దగ్గరకు వచ్చేసరికి అవి కూడా తడబడుతున్నాయి. పాత కాలపు వార్తాపత్రికలు, గ్రాఫ్‌లు ఉన్న మ్యాగజైన్లు లేదా చారిత్రక పత్రాలను ప్రాసెస్ చేసేటప్పుడు ఇవి తప్పుడు సమాచారాన్ని (Hallucinations) సృష్టిస్తున్నాయి. ఈ గ్యాప్‌ను భర్తీ చేయడానికే సర్వం AI ‘అక్షర్’ను తీసుకొచ్చింది. ఇది కేవలం టెక్స్ట్‌ను వెలికితీయడమే కాకుండా, ఆ టెక్స్ట్ పేజీలో ఎక్కడ ఉంది (Visual Grounding), దాని లేఅవుట్ ఎలా ఉంది అనే అంశాలను విశ్లేషించి ఆటోమేటెడ్ ప్రూఫ్ రీడింగ్‌ను కూడా చేస్తుంది.

1800వ కాలం నాటి పాత గుజరాతీ లేదా తమిళ రాతప్రతులను డిజిటలైజ్ చేయడాన్ని ఒక ఉదాహరణగా తీసుకుంటే, సాధారణ AI మోడళ్లు వాటిలోని పాత అక్షరాలను ఇప్పటి కాలపు స్పెల్లింగ్‌లుగా తప్పుగా మారుస్తాయి. దీనివల్ల ఒక భాషా నిపుణుడు కూర్చుని ప్రతి లైన్‌ను సరిచూడాల్సి ఉంటుంది. ఇది చాలా సమయం తీసుకునే ప్రక్రియ. కానీ ‘అక్షర్’ టూల్ తన ఏజెంట్ లూప్ ద్వారా ఎక్కడైతే అక్షరాలపై సందేహం ఉందో వాటిని ముందే గుర్తిస్తుంది. దీనివల్ల ఒక నిపుణుడు గంటల తరబడి చేసే పనిని కేవలం కొద్ది నిమిషాల్లోనే పూర్తి చేయవచ్చు.

🚀 Subscribe to Ramthamedia WhatsApp & Telegram Channels for News, Articles, Reviews & Books!
రామ్తామీడియా లేటెస్ట్ వార్తలు, ప్రత్యేక కథనాలు మీ ఫోన్లో అందుకోవడానికి ఇప్పుడే సబ్‌స్క్రైబ్ చేసుకోండి.

తెలంగాణ ప్రభుత్వం మరియు కేంద్ర ప్రభుత్వ సంస్థలు తమ పాత రికార్డులను భద్రపరచడానికి, డిజిటలైజ్ చేయడానికి ఇలాంటి స్వదేశీ సాంకేతికతను ఉపయోగించుకోవడం ద్వారా అద్భుతమైన ఫలితాలను సాధించవచ్చు. డిజిటల్ ఇండియా మిషన్‌లో భాగంగా ప్రతి సామాన్యుడికి వారి సొంత భాషలో సమాచారం అందాలంటే, ఇలాంటి టూల్స్ అత్యంత కీలకం. RBI వంటి సంస్థలు కూడా తమ వద్ద ఉన్న భారీ డాక్యుమెంట్లను డేటాగా మార్చడానికి ‘అక్షర్’ వంటి టూల్స్‌ను వినియోగించుకునే అవకాశం ఉంది. భవిష్యత్తులో భారతీయ భాషా విజ్ఞానాన్ని భద్రపరచడంలో సర్వం AI ఒక మైలురాయిగా నిలుస్తుందని చెప్పడంలో ఎలాంటి సందేహం లేదు.

అధికారిక సమాచారం కోసం ఈ వనరులు చూడండి:

Sarvam AI Official Blog – https://www.sarvam.ai/blog

India AI Mission – https://indiaai.gov.in

Ministry of Electronics and IT – https://www.meity.gov.in

అత్యంత ఖచ్చితమైన సమాచారం కోసం పై అధికారిక వనరులను సందర్శించండి.

గమనిక: ఈ కథనం అధికారిక సమాచారం మరియు ప్రజా వనరుల ఆధారంగా రూపొందించబడింది. పూర్తి వివరాల కోసం అధికారిక వెబ్‌సైట్లను పరిశీలించాలి.

Leave a Reply

Your email address will not be published. Required fields are marked *