दो टेक्स्ट स्ट्रिंग्स पास करें और उनके बीच समानता प्रतिशत प्राप्त करें
प्लेगरिज्म पहचान: शैक्षणिक संस्थान और सामग्री प्रकाशक API का उपयोग छात्र सबमिशन या प्रकाशित लेखों की तुलना करने के लिए कर सकते हैं मौजूदा दस्तावेजों के साथ उच्च समानता स्कोर का पता लगाकर यह संभावित प्लेगरिज्म या डुप्लिकेट सामग्री के मामलों की पहचान कर सकता है
सामग्री अनुशंसा: ई-कॉमर्स प्लेटफार्मों स्ट्रीमिंग सेवाओं और समाचार वेबसाइटों को समान उत्पादों फिल्में या लेखों की अनुशंसा करके उपयोगकर्ता अनुभव को बढ़ा सकते हैं API उपयोगकर्ता प्राथमिकताओं का विश्लेषण कर सकता है और उनके पिछले चुनावों के लिए उच्च समानता स्कोर वाले आइटम सुझा सकता है
ग्राहक सेवा चैटबॉट: ग्राहक सहायता प्रणालियाँ API का उपयोग चैटबॉट प्रतिक्रिया में सुधार के लिए कर सकती हैं ग्राहक प्रश्नों और अक्सर पूछे जाने वाले प्रश्न या पिछले इंटरैक्शन के डेटाबेस के बीच समानता का विश्लेषण करके चैटबॉट अधिक सटीक और प्रासंगिक उत्तर प्रदान कर सकता है
दस्तावेज़ क्लस्टरिंग और संगठन: बड़ी मात्रा में दस्तावेजों से निपटने वाले संगठनों जैसे कानूनी फर्म या अनुसंधान संस्थान API का उपयोग सामग्री समानता के आधार पर दस्तावेजों को क्लस्टर और श्रेणीबद्ध करने के लिए कर सकते हैं यह कुशल दस्तावेज प्रबंधन और वसूली में सहायता करता है
सर्च इंजन संवर्धन: सर्च इंजन API का लाभ उठाकर खोज परिणामों में सुधार कर सकते हैं उपयोगकर्ता प्रश्नों और अनुक्रमित पृष्ठों के बीच समानता की तुलना करके API सबसे प्रासंगिक परिणामों को रैंक और प्रदर्शित कर सकता है जिससे उपयोगकर्ताओं के लिए समग्र खोज अनुभव में सुधार होता है
API कॉल की संख्या के अलावा कोई अन्य सीमा नहीं है
{"similarity": 0.8126154541969299}
curl --location --request POST 'https://zylalabs.com/api/4499/content+similarity+analysis+api/5520/check+similarity' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{"text_1": "This is an example sentence.",
"text_2": "This is just another example sentence."}'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
एपीआई यूटीएफ-8 प्रारूप में साधारण पाठ इनपुट स्वीकार करता है छोटे वाक्यांशों और लंबे पैराग्राफ दोनों को संसाधित किया जा सकता है जिससे विभिन्न अनुप्रयोगों में लचीले उपयोग की अनुमति मिलती है
यह एपीआई उन्नत एनएलपी मॉडल का उपयोग करके पाठ को 768-आयामी वेक्टर में एम्बेड करता है और फिर इन वेक्टरों के बीच कोसाइन समानता की गणना करता है ताकि एक समानता स्कोर उत्पन्न हो सके जो -1 से 1 के बीच होता है जहां 1 समान पाठ को इंगीत करता है
एपीआई अत्याधुनिक ट्रांसफार्मर-आधारित मॉडलों का उपयोग करता है जैसे कि बीईआरटी या इसके प्रकार पाठों को एम्बेड करने के लिए ये मॉडल बड़े निगमों पर पूर्व-प्रशिक्षित होते हैं और अर्थ की सटीकता को पकड़ने के लिए उच्च सटीकता के लिए फाइन-ट्यून किए जाते हैं
एपीआई को कम विलंबता के लिए ऑप्टिमाइज़ किया गया है आमतौर पर मानक अनुरोधों के लिए कुछ सौ मिलीसेकंड के भीतर प्रतिक्रिया करता है प्रदर्शन इनपुट पाठों की लंबाई और जटिलता के आधार पर भिन्न हो सकता है
हाँ, एपीआई कई भाषाओं का समर्थन करता है, बशर्ते कि अंतर्निहित एम्बेडिंग मॉडल का प्रशिक्षण बहुभाषीय डेटा पर किया गया हो। इससे विभिन्न भाषाओं के बीच सटीक समानता गणनाओं की अनुमति मिलती है
जांच समानता एंडपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें एकल कुंजी "समानता" होती है जो दो इनपुट लेखों के बीच समानता स्कोर का प्रतिनिधित्व करती है स्कोर 0 से 1 के बीच होता है जहां 1 समान सामग्री को इंगित करता है और 0 कोई समानता नहीं इंगित करता है
प्रतिक्रिया डेटा में "समानता" क्षेत्र शामिल है जो एक फ्लोटिंग-पॉइंट संख्या है यह मान प्रदान किए गए दो पाठ इनपुट के बीच समानता के स्तर को मापता है
उपयोगकर्ता अपने अनुरोधों को दो पाठ पैरामीटर `text_1` और `text_2` प्रदान करके अनुकूलित कर सकते हैं जिनकी अधिकतम लंबाई 5000 अक्षर है यह विशेष सामग्री विश्लेषण की आवश्यकताओं के आधार पर लचीला इनपुट प्रदान करता है
प्रतिक्रिया डेटा JSON प्रारूप में संरचित है जिसमें एक एकल कुंजी-मूल्य जोड़ी है कुंजी "सादृश्यता" है और मूल्य एक संख्यात्मक स्कोर है जो दो पाठों के बीच की सादृश्यता को दर्शाता है
सामान्य उपयोग मामले में शैक्षिक सेटिंग में साहित्यिक चोरी का पता लगाना ई-कॉमर्स में सामग्री अनुशंसा करना ग्राहक सेवा में चैटबॉट प्रतिक्रियाओं को बढ़ाना और शोध या कानूनी संदर्भों में कुशल संगठन के लिए दस्तावेज़ों को समूहित करना शामिल हैं
डेटा की सटीकता को व्यापक डेटा सेट्स पर पूर्व-प्रशिक्षित उन्नत एनएलपी मॉडल के उपयोग के माध्यम से बनाए रखा जाता है निरंतर अपडेट और ठीक करना यह सुनिश्चित करता है कि मॉडल अर्थात्मक महत्व को पकड़ने और विश्वसनीय समानता स्कोर प्रदान करने में प्रभावी बने रहें
यदि एक या दोनों टेक्स्ट इनपुट खाली हैं तो API आमतौर पर 0 की समानता स्कोर लौटाएगा जो कोई समानता नहीं दर्शाता है उपयोगकर्ताओं को सुनिश्चित करना चाहिए कि दोनों इनपुट में मान्य पाठ हो ताकि सार्थक परिणाम मिल सकें
उपयोगकर्ता समानता स्कोर की अपेक्षा कर सकते हैं जो सामग्री के आधार पर भिन्न होते हैं स्कोर जो 1 के करीब होते हैं वे उच्च समानता को दर्शाते हैं जबकि स्कोर जो 0 के करीब होते हैं वे महत्वपूर्ण भिन्नताओं का सुझाव देते हैं तुलना की जा रही सामग्री के प्रकार के आधार पर पैटर्न उभर सकते हैं जैसे शैक्षणिक पत्र बनाम आकस्मिक लेखन
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
575ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,147ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,134ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
86ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
295ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
205ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
454ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
326ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
302ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
22ms
सर्विस लेवल:
94%
रिस्पॉन्स टाइम:
658ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
883ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,142ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
13,713ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
603ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,100ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,503ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,255ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,306ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,350ms