basis211: (Default)
[personal profile] basis211
Для одного рабочего вопроса нужно, кому не лень накидайте пожалуйста несколько мнений - что сейчас модно и кошерно использовать для обработки и наверное парсинга изображений на Питоне? Плюс вообще речь идет о создани каких-то алгоритмов / математического аппарата для параллельной обработки очень большого  количества документов от юзеров.
Вся эта хреновина, о которой я говорю - бэкенд, а фронтенд у нее - мобильное приложение, все это будет космически и нечеловечески нагружено :) и так далее и все такое.

(в программировании практически ничего не понимаю)
Спасибо.

Date: 2019-05-29 02:15 pm (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
ocr? gocr хорошо работает

Date: 2019-05-29 03:07 pm (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
Это если текст извлекать. Я одно время его использовал, пока страховые компании не цивилизовались и не перестали вставлять части текста в виде картинок внутри pdf.

Date: 2019-05-31 06:18 am (UTC)
m0z9: (Default)
From: [personal profile] m0z9
Какие, чёрт возьми, умные люди тут в окрестности. И до чего дошёл прогресс.

Date: 2019-06-03 08:30 pm (UTC)
From: [personal profile] yussouf
Я бы посоветовал расширить скоуп за Питон.
Тогда и опций больше, и гибкоти.

Тащем-то, в современном, так сказать, мире микросервисов - интерконнективити не то чтоб очень уж проблема, нет нуджы привязываться к нативным биндингам (Питона или еще чего-то).

Конкретно, помимо упомянутого, из бесплатного есть заслуженный Tesseract (еще HP начинала!)
Кажется, шо-то было и у Microsoft

Если не исключать платное - то там целая тележка от етого всего.

Плюс, есть готовые клауд-сервисы (у каждого из большой облачной тройки точно, + независимые наверняка)
Page generated Jan. 27th, 2026 06:16 am
Powered by Dreamwidth Studios