该API是一个OCR(光学字符识别)工具。您传递给它的任何图片将被检查并提取其中的每一个单词。
您需要传递您选择的图像URL。您将获得该图像中的文本内容。这是一个非常直观的API,您会对结果感到惊讶。
该API非常适合那些存储了大量图像并希望提取其包含文本的公司。这将帮助您识别您的品牌是否在网上的图像中未经授权使用。
此外,该API将帮助您对带有文本的图像进行分类。通过字符识别,您将获得完整的单词,并能够仅通过阅读其文本来检测该图像的类别。
除了每月的API调用限制外,所有计划的工作方式是相同的!
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://file.io/GiqYoEWsoy9i","md5":"d4438cf64b5544dc22854b6585d8c398","width":2160,"height":3840,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.11990740740740741,0.019010416666666665,0.8467592592592592,0.89453125],"entities":[{"kind":"text","name":"text","text":"تحديات تؤثر على خدمة الذكاء الاصطناعى للغة العربية - التشكيل\nC\n00\nه استخدام القرآن الكريم\nيعتبر القرآن الكريم أكبر\nمصدر للغة العربية ولكن\nيصعب في بعض الأحيان\nاستخدامه في تدريب نماذج\nالذكاء الاصطناعي لتجنب\nتحريف المعنى. هناك بعض\nالنماذج التي تم تدريبها\nعلى القرآن الكريم، ولكن لم\nتزل هناك حاجة للمزيد من\nالجهود في هذا المجال.\nقه الكتابة من اليمين إلى اليسار\nتكتب اللغة العربية من اليمين إلى اليسار، وهذا يشكل تحديا في تطوير\nنماذج الذكاء الاصطناعي القادرة على الفهم والتعامل مع هذا النوع\nمن اللغات، مع أن هناك بعض النماذج التى تم تدريبها على الكتابة\nمن اليمين إلى اليسار، ولكن لم تزل هناك تحسينات مطلوبة لجعلها\nأكثر قبولاً وفعالية.\nوم الأرقام العربية\n09\nولّدت الأرقام العربية على أنها أرقام إنجليزية، فالرقم . (صفر) من\nالصعب توليده في الذكاء الاصطناعي، إذ يعتقد أنه عبارة عن نقطة."}]}]}]}]}
curl --location --request POST 'https://zylalabs.com/api/37/optical+character+recognition+api/108/image+analysis?url=https://storage.googleapis.com/api4ai-static/samples/ocr-1.png' --header 'Authorization: Bearer YOUR_API_KEY'
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://gopostr.s3.amazonaws.com/binary_file_test_1679/tEMRXL7fQiIgoCXMcQ7UUWHcyqtYa4IeTb1NoAyt.jpg","md5":"f556d7e2b92037ea8b6af4d731597f1d","width":464,"height":479,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.4547413793103448,0.6868475991649269,0.44396551724137934,0.16075156576200417],"entities":[{"kind":"text","name":"text","text":"10\nAFA\nSAVE THE\nPLONET"}]}]}]}]}
curl --location 'https://zylalabs.com/api/37/optical+character+recognition+api/1679/image+analysis+with+file' \
--header 'Content-Type: application/x-www-form-urlencoded' \
--form 'image=@"FILE_PATH"'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
每个端点以JSON格式返回从提供的图像中提取的文本。响应包括请求状态、图像URL、尺寸以及识别的文本及其边界框坐标的详细信息
响应中的关键字段包括“状态”(表示成功或失败)“名称”(图像 URL)“宽度”和“高度”(尺寸)以及“实体”(包含识别的文本及其在图像中的位置)
响应数据被结构化为一个包含“results”数组的JSON对象 每个结果包含有关图像的元数据和一个“entities”数组 该数组详细说明了识别的文本及其边界框坐标
每个端点提供了关于从图像中提取的文本的信息,包括识别的单词、它们的位置和图像的整体尺寸。这对于文本分析和分类非常有用
典型的用例包括数字化印刷文档、监测品牌在图像中的使用以及根据图像所包含的文本对其进行分类 企业可以利用这些数据进行内容管理和合规性
用户可以通过解析 JSON 响应来提取识别的文本及其坐标,以利用返回的数据。这些信息可用于进一步分析、索引或集成到应用程序中以增强功能
端点接受一个参数:图像 URL 或图像文件本身。图像必须为 JPEG 或 PNG 格式且大小小于 16 MB。确保 MIME 类型与接受的格式匹配以便成功处理
数据准确性通过使用先进的OCR算法来维护,这些算法分析图像内容。此API旨在处理各种文本样式和布局,确保从不同的图像来源中可靠地提取文本