{"status":"success","response_data":[["Apple","appl!e",1.0]]}
curl --location --request POST 'https://zylalabs.com/api/11918/efficient+matching+similarity+api/22651/dedupe?data=["Apple", "appl!e"]' --header 'Authorization: Bearer YOUR_API_KEY'
साइन अप करने के बाद, प्रत्येक डेवलपर को एक पर्सनल API एक्सेस की असाइन की जाती है, जो अक्षरों और अंकों का एक यूनिक संयोजन होता है, जिसका उपयोग हमारे API एंडपॉइंट तक पहुंचने के लिए किया जाता है। प्रमाणीकरण के लिए प्रभावी मिलान समानता API के साथ बस अपने बेयरर टोकन को Authorization हेडर में शामिल करें।
| हेडर | विवरण |
|---|---|
Authorization
|
आवश्यक
होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें।
|
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
अग्रणी कंपनियों का भरोसा
कुशल मिलान समानता एपीआई वास्तविक दुनिया के अव्यवस्थित डेटा के लिए निर्मित एक उच्च-गति धुंधला मिलान और डुप्लीकेशन एपीआई है यह आपको लगभग समान रिकॉर्ड पहचानने और संस्थाओं को मिलाने में मदद करता है भले ही मान बिल्कुल मेल न खाएं—टाइपो, केस भिन्नताएँ, लापता विराम चिह्न, स्पेसिंग मुद्दे, संक्षेपण और छोटे शब्द क्रम परिवर्तन।
अपनी खुद की धुंधली मिलान पाइपलाइन बनाने और ट्यून करने के बजाय आप अपने स्ट्रिंग (या रिकॉर्ड) एपीआई को भेजते हैं और आपको समानता-संख्यांकित मिलान प्राप्त होते हैं जिन पर आप भरोसा कर सकते हैं सामान्य आउटपुट में मेल खाती जोड़ी (जैसे, “सेब” ↔ “एप्पल इंक।”), समानता स्कोर और संरचित परिणाम होते हैं जिन्हें डेटा सफाई कार्यप्रवाह, सीआरएम, ईटीएल नौकरी और विश्लेषिकी पाइपलाइनों में लगाना आसान होता है।
सामान्य उपयोग के मामले:
सूची को डुप्लीकेट करें: एक डेटा सेट के अंदर डुप्लिकेट खोजें (सबसे सभी मिलान) और संभावित डुप्लिकेट पेयर लौटाएं।
मास्टर सूची के खिलाफ मिलान करें: एक आने वाली सूची को एक मानक सेट से मिलाएं (सूची-से-मास्टर)।
सीआरएम और ग्राहक डेटा स्वच्छता: ऐसे लीड/खाते/कंपनियों को साफ करें जहां डुप्लिकेट रिपोर्टिंग और आउटरीच को तोड़ते हैं।
संस्थान समाधान और रिकॉर्ड लिंकिंग: स्रोतों में एक ही वास्तविक दुनिया की संस्था के संदर्भों को जोड़ें।
टीमें इसका उपयोग क्यों करती हैं:
बॉक्स से बाहर अव्यवस्थित पाठ पर काम करता है (हर एज केस के लिए कोई मैनुअल नियम नहीं)
रैंकिंग और थ्रेशोल्ड के लिए समानता स्कोर (आप चुनते हैं कि कितने सख्त होना है)
स्केल और स्वचालन के लिए बनाया गया (पाइपलाइनों में चलाने के लिए डिज़ाइन किया गया है, सिर्फ एक बार के स्क्रिप्ट के लिए नहीं)
डिडुप एンドपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें मेल खाने वाले स्ट्रिंग्स के जोड़े, समानता स्कोर और वैकल्पिक डिडुप्लिकेटेड परिणाम होते हैं आउटपुट को स्ट्रिंग जोड़ों, इंडेक्स जोड़ों या डिडुप्लिकेटेड स्ट्रिंग्स के रूप में प्रारूपित किया जा सकता है जो निर्धारित कॉन्फ़िगरेशन के आधार पर है
प्रतिक्रिया डेटा में मुख्य क्षेत्रों में "स्थिति" शामिल है (जो सफलता या त्रुटि को दर्शाता है) और "प्रतिक्रिया_डेटा," जिसमें उपयोगकर्ता के अनुरोध के अनुसार स्वरूपित परिणाम होते हैं, जैसे मेल खाते जोड़े या डिडुप्लिकेट की गई स्ट्रिंग्स
उपयोगकर्ता "config" ऑब्जेक्ट में पैरामीटर्स को समायोजित करके अनुरोधों को अनुकूलित कर सकते हैं जैसे "similarity_threshold" मिलान की कठोरता के लिए "remove_punctuation" पूर्व-प्रसंस्करण के लिए और "output_format" वांछित परिणाम संरचना चुनने के लिए
प्रतिक्रिया डेटा परिणामों के एक एल्गो में व्यवस्थित है जहां प्रत्येक प्रविष्टि एक मैच या डिडुप्लिकेटेड स्ट्रिंग के अनुसार होती है आउटपुट प्रारूप के आधार पर प्रविष्टियों में मूल स्ट्रिंग्स अनुक्रमांक और समानता स्कोर शामिल हो सकते हैं जो वर्कफ़्लोज़ में आसान एकीकरण की सुविधा प्रदान करते हैं
प्रमुख उपयोग के मामलों में ग्राहक सूचियों को डिडुप्लिकेट करना मुख्य सूची के खिलाफ रिकॉर्ड का मिलान करना CRM डेटा को साफ करना और विभिन्न डेटा स्रोतों में एंटिटी समाधान करना शामिल है ताकि डेटा की अखंडता और सटीकता सुनिश्चित की जा सके
डेटा की सटीकता उन्नत फजी मिलान एल्गोरिदम के माध्यम से बनाए रखी जाती है जो टाइपो और केस में भिन्नताओं जैसी सामान्य डेटा समस्याओं को ध्यान में रखती है एपीआई को गंदे डेटा को प्रभावी ढंग से संभालने के लिए डिज़ाइन किया गया है जिससे विश्वसनीय मिलान परिणाम सुनिश्चित होते हैं
स्वीकृत पैरामीटर मानों में "similarity_threshold" (0 से 1), "remove_punctuation" (बूलियन), "to_lowercase" (बूलियन), "use_token_sort" (बूलियन), और "top_k" (पूर्णांक या "all") शामिल हैं ये पैरामीटर उपयोगकर्ताओं को उनकी विशिष्ट आवश्यकताओं के अनुसार मिलान प्रक्रिया को अनुकूलित करने की अनुमति देते हैं
यदि डिडुप्लीकेट एंडपॉइंट आंशिक या खाली परिणाम लौटाता है तो उपयोगकर्ताओं को गुणवत्ता समस्याओं जैसे अधिक डुप्लिकेट या बहुत कम समानता थ्रेशोल्ड के लिए इनपुट डेटा की जांच करनी चाहिए "समानता_थ्रेशोल्ड" को समायोजित करना या इनपुट सूची की समीक्षा करना परिणामों में सुधार करने में मदद कर सकता है