informations générales
- Emploi
- CDI
3+ ans en React/Next.js + Node.js ou Python/FastAPI Maîtrise TypeScript, GraphQL, WebSockets
Expérience concrète avec LLM, RAG, LangChain, embeddings, vector DB
Vous avez déjà fine-tuné un modèle, construit un agent autonome ou optimisé un pipeline RAG Bonus : ONNX, vLLM, prompt engineering, évaluation LLM (BLEU, BERTScore)
Conditions :
CDI / CDD ou Freelance – Bastia Télétravail possible après 1 mois d’essai
42-55k€ brut/an + BSPCE + MacBook Pro M3 Max + GPU dédié Accès Hugging Face Pro
- 2025-11-08
Nous recherchons un Développeur Web Full-Stack pour accélérer le développement de notre IA interne propriétaire (LLM custom, RAG pipelines, agents multi-modaux) et livrer des fonctionnalités toujours plus puissantes et rapides.
Missions :
- Développer l'interface web (Next.js 14 + tRPC + Tailwind) des outils IA internes (éditeur de prompts, debugger d’agents, visualiseur de mémoire vectorielle).
- Intégrer et optimiser notre stack IA maison : LangChain, LlamaIndex, custom embeddings (Sentence Transformers), FAISS/Pinecone, fine-tuning (Mistral, Phi-3 via LoRA/QLoRA).
- Automatiser le déploiement de modèles (Docker, Kubernetes, GitHub Actions) et la quantization (GGUF, AWQ, TensorRT).
- Implémenter RAG from scratch, tool calling, function calling, human-in-the-loop feedback.
- Booster la vitesse d’inférence (caching Redis, batching, streaming tokens).
Profil :
- 3+ ans en React/Next.js + Node.js ou Python/FastAPI
- Maîtrise TypeScript, GraphQL, WebSockets
- Expérience concrète avec LLM, RAG, LangChain, embeddings, vector DB
- Vous avez déjà fine-tuné un modèle, construit un agent autonome ou optimisé un pipeline RAG
- Bonus : ONNX, vLLM, prompt engineering, évaluation LLM (BLEU, BERTScore)
Conditions :
- CDI / CDD ou Freelance – Bastia
- Télétravail possible après 1 mois d’essai
- 42-55k€ brut/an + BSPCE + MacBook Pro M3 Max + GPU dédié
- Accès Hugging Face Pro
À propos de Yiaho
Yiaho est une startup IA basée en Corse, spécialisée dans le développement de solutions d’intelligence artificielle générative et d’automatisation intelligente. Nous concevons des agents autonomes basés sur des LLM (Large Language Models), des pipelines RAG (Retrieval-Augmented Generation) et des architectures multi-agents



