Как извлечь текст из изображений с помощью командной строки

Достаточно легко прочитать изображение и вытащить текст самостоятельно. Но динамическое извлечение текста из фотографии немного сложнее, и, к счастью, imgclip предлагает довольно простое решение.

Этот инструмент командной строки работает в терминале для Mac, Windows и Linux. Он просто принимает аргумент для файла изображения вместе с языком, а затем возвращает текст, скопированный в буфер обмена.

Читайте также: почему все разработчики должны изучать командную строку

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Вы можете установить всю библиотеку с помощью npm, и это довольно простая установка. Это всего лишь несколько КБ, и он поставляется с файлом JS, который вы можете просматривать на GitHub.

Imgclip использует Tesseract.js библиотека для автоматизации обработки изображений и вытягивания текста через OCR. Это одна из самых мощных библиотек OCR на сегодняшний день, и она полностью с открытым исходным кодом, как и imgclip.

Я думаю, что я больше всего впечатлен качеством и скоростью этого инструмента. Это действительно работает, чтобы получить точный текст, и это один из самых простых инструментов для использования.

Команда imgclip должна быть запущена непосредственно в терминале с указанием относительного пути к изображению. Вы также можете добавить четыре варианта в конце, чтобы настроить вывод.

  1. -h, –help: выводит информацию об использовании
  2. -V, –version: выводит номер версии
  3. -l, –lang: выводит язык текста на изображении
  4. -p, –print: печатает текст на изображении (вместо копирования в буфер обмена)

На момент написания статьи, Tesseract поддерживает 65 языков с больше на пути. Код, который вы добавляете к тегу –lang, должен соответствовать коду, используемому в этих файлах Tesseract.

Например, -l eng будет искать изображение для английского текста, в то время как -l jpn будет искать японский текст, и вы даже можете запустить -l jpn_vert для поиска вертикально ориентированного японского текста.

Поскольку imgclip сильно зависит от Tesseract, вы в основном имеете всю мощь этой библиотеки в вашем распоряжении.

Чтобы начать, посетите Страница GitHub и скачайте копию локально или установите ее в определенную директорию через npm. Затем вы можете запустить инструмент в терминале, как приложение, для анализа любого изображения, которое вы хотите.

Чтобы увидеть imgclip в действии, проверьте это краткое видео созданный как демо imgclip.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *