אנחנו מחפשים מפתח/ת AI בעל/ת ניסיון בפיתוח פתרונות לחילוץ טקסט מדויק מקבצי PDF, במיוחד כאלה בתחום הרגולציה והזנתו לבסיסי נתונים מובנים.
תיאור הדרישות:
פיתוח מודלים לניתוח וחילוץ טקסט ממסמכי PDF (כולל מסמכים סרוקים ולא אחידים).
שימוש בכלים מתקדמים כמו OCR, NLP ו-LLM לצורך עיבוד תוכן
התאמת הפתרון לצרכים עסקיים ולשפות עברית ואנגלית.
מיפוי והזנת המידע לתוך בסיסי נתונים (SQL/NoSQL) באופן מובנה
דרישות:
ניסיון מעשי בחילוץ טקסט מקבצי PDF כלי OCR (כגון Tesseract, Textract, PyMuPDF וכו')
הכרות עם כלי OCR (Tesseract, Adobe, Google Vision וכו’).
ניסיון בעבודה עם בסיסי נתונים (SQL/NoSQL) – חובה
ניסיון בעבודה עם LLMs – יתרון.