वॉइस रिकॉग्निशन एपीआई एक शक्तिशाली और सटीक उपकरण है जिसे बोले गए शब्दों को व्यवस्थित पाठ में बदलने के लिए डिज़ाइन किया गया है। उन्नत भाषण पहचान और एआई तकनीक का उपयोग करते हुए, यह विभिन्न उद्योगों और अनुप्रयोगों के लिए उच्च गुणवत्ता वाले ट्रांसक्रिप्शन प्रदान करता है। लाइव भाषण या पूर्व-रिकॉर्डेड ऑडियो फ़ाइलों को संसाधित करते समय, यह एपीआई न्यूनतम त्रुटियों के साथ विश्वसनीय और सटीक रूपांतरण की गारंटी देता है।
इस एपीआई की एक प्रमुख विशेषता इसकी बहुभाषी समर्थन है, जो उपयोगकर्ताओं को कई भाषाओं में ऑडियो का ट्रांसक्रिप्शन करने की अनुमति देती है अत्यधिक सटीकता के साथ। यह सुविधा विभिन्न भाषाओं में ट्रांसक्रिप्शन की आवश्यकता रखने वालों के लिए इसे एक अनिवार्य उपकरण बनाती है।
{"success":true,"audio_file":"https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3","output":{"text":"Ciao a tutti, come state?","result":{"text":"Ciao a tutti, come state?","word_count":5,"vtt":"WEBVTT\n\n00.000 --> 01.860\nCiao a tutti, come state?","words":[{"word":"Ciao","start":0,"end":0.23999999463558197},{"word":"a","start":0.23999999463558197,"end":0.4000000059604645},{"word":"tutti,","start":0.4000000059604645,"end":1.0800000429153442},{"word":"come","start":1.0800000429153442,"end":1.2799999713897705},{"word":"state?","start":1.2799999713897705,"end":1.8600000143051147}]}}}
curl --location --request POST 'https://zylalabs.com/api/6370/voice+recognition+api/9135/audio+to+text?url=https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
वॉयस मान्यता एपीआई प्रदान किए गए ऑडियो फ़ाइल से लिप्यांकीत पाठ लौटाता है आउटपुट में मान्यता प्राप्त भाषण शामिल होता है जिसे संरचित पाठ प्रारूप में परिवर्तित किया जाता है जिससे उपयोगकर्ता बोले गए सामग्री को आसानी से एक्सेस और उपयोग कर सकें
प्रतिक्रिया डेटा में आमतौर पर "ट्रांसक्रिप्शन" (परिवर्तित पाठ), "भाषा" (ऑडियो की पहचान की गई भाषा), और "विश्वास" (ट्रांसक्रिप्शन की सटीकता को दर्शाने वाला स्कोर) जैसे फ़ील्ड शामिल होते हैं
उपयोगकर्ता "audio_url" (ऑडियो फ़ाइल का यूआरएल) और "language" (ऑडियो की भाषा को दर्शाने के लिए) जैसे पैरामीटर निर्दिष्ट कर सकते हैं इन पैरामीटर्स से ट्रांसक्रिप्शन प्रक्रिया को बेहतर सटीकता के लिए अनुकूलित करने में मदद मिलती है
उत्तर डेटा JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य जोड़ होते हैं जो अनुलेखन परिणामों का प्रतिनिधित्व करते हैं यह संरचना आसान पार्सिंग और अनुप्रयोगों में एकीकरण की अनुमति देती है जिससे आगे की प्रसंस्करण या प्रदर्शन सुगम होता है
परंपरागत उपयोग के मामले में बैठकें लिखना वीडियो के लिए उपशीर्षक उत्पन्न करना साक्षात्कारों का लिखित रिकॉर्ड बनाना और अनुप्रयोगों में.voice कमांड सक्षम करना शामिल है API की बहुभाषी समर्थन इसकी विभिन्न उद्योगों में उपयोगिता को बढ़ाता है
डेटा की सटीकता उन्नत भाषण मान्यता एल्गोरिदम और विविध डेटा सेटों पर लगातार प्रशिक्षण के माध्यम से बनाए रखी जाती है नियमित अपडेट और गुणवत्ता जांच सुनिश्चित करती हैं कि एपीआई विभिन्न लहजों और भाषण पैटर्न के साथ अनुकूलित होता है
उपयोगकर्ता खोजने की क्षमता, विश्लेषण या प्रदर्शन के लिए ट्रांसक्राइब किए गए पाठ को अपने अनुप्रयोगों में एकीकृत करके लौटाए गए डेटा का उपयोग कर सकते हैं संरचित प्रारूप आसान हेरफेर की अनुमति देता है जैसे कि कीवर्ड को उजागर करना या सारांश उत्पन्न करना
मानक डेटा पैटर्न में संगत वाक्य, विराम चिह्न और बोले गए सामग्री के आधार पर सही प्रारूपण शामिल होते हैं उपयोगकर्ता ऑडियो की गुणवत्ता और भाषण की स्पष्टता के आधार पर लंबाई और जटिलता में भिन्नताएँ अनुभव कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,503ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
426ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
883ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
558ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
17,611ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,494ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
13,713ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
816ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
148ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
319ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
939ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
721ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
645ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
820ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
596ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
0ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
9ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
797ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
980ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
17ms