★エンド直【Python/VLM/フルリモート】ドキュメント構造化R&Dエンジニア(Visual RAG)

案件要件
- 職種
- エンジニア
- 業務内容
- SES
- 報酬目安
- 5,785 ~ 6,097円/時
- 稼働時間目安
- 週5日 (時間目安 160時間)
- はたらく場所
- フルリモート
- スキル
案件概要
担当業務
・VLM等の最新技術を活用し、ドキュメント構造化の信頼性や機能を向上させるための研究開発および検証をリードいただきます。
・単なるPoCにとどまらず、実運用を見据えた「使える技術」への昇華を担っていただきます。
・VLMを活用したドキュメント構造化パイプラインの構築・改善を行っていただきます。
・プロンプトチューニングなどによるVLM出力精度の向上と、バリデーション機能の開発を行っていただきます。
・図面解析など、顧客課題に応じたPoCの技術検証・実施を行っていただきます。
開発環境
使用言語・フレームワークとしてPython、TypeScript、Vue.js、Node.jsを利用しています。
コンテナとしてDockerを利用しています。
IaCとしてTerraformを利用しています。
クラウドとしてAWSとAzureを利用しています。
求めるスキル
必須スキル
・理工系大学院を修了していること
・LLMまたはVLMを活用したアプリケーション開発、またはPoCの実施経験
・Pythonを用いたR&Dまたはサービス開発経験
・RAG(Retrieval-Augmented Generation)の基本的な仕組みの理解
・未知の技術領域(特にマルチモーダルモデル)に対する調査・検証能力
歓迎スキル
・画像処理・Computer Visionに関する知識(OCR、レイアウト解析、物体検出等)
・複数のVLMモデルの比較検証やパイプライン構成の経験
・論文調査(ArXiv等)を行い、実装に落とし込める能力
・顧客課題を技術課題に翻訳し、解決策を提案した経験
その他
精 算:140-180h(想定)
時 期:長期
場 所:フルリモート
サイト:月末締め翌月15日支払い(15日サイト)
株式会社ココナラテック
フリーランスITエンジニア向け案件・求人サイト
業界最大級の案件掲載実績があるフリーエンジニアのIT案件・求人サイト「ココナラテック」なら、初心者でもスキルアップできる案件から収入アップを狙える高単価案件まで多数あります。
