Aller au contenu

Serveur MCP — connecter n'importe quel client IA

OculiX embarque un serveur MCP (oculixmcp) qui expose le moteur d’automatisation visuelle — clic, frappe, recherche, OCR, capture — à tout client Model Context Protocol. Chaque action est signée (Ed25519) et écrite dans un journal d’audit chaîné par hachage : le serveur est conçu pour des environnements maîtrisés et auditables, pas pour un usage grand public libre.

L’artefact exécutable est oculix-mcp-server.jar. Deux transports :

Fenêtre de terminal
# Transport par défaut — Claude Desktop, Cursor, VS Code, Gemini CLI…
java -jar oculix-mcp-server.jar run

Variables d’environnement :

VariableEffet
OCULIX_MCP_TOKENJeton client pré-partagé qui garde initialize (recommandé pour tout bind non-loopback)
OCULIX_MCP_MODEopen ou confidential — le mode confidentiel range les sorties sensibles dans un coffre
OCULIX_MCP_VAULTChemin du répertoire coffre (mode confidentiel)
OCULIX_MCP_TRUST_TLS_TERMINATIONAcquitter une terminaison TLS en amont pour un bind non-loopback (sinon le HTTP clair sur interface publique est refusé)

Audit / clés : verify, rotate-key, rotate-session-key, recover.

Presque tous les clients MCP utilisent l’une de quatre formes de config. Choisissez le vôtre.

Fichier : ~/Library/Application Support/Claude/claude_desktop_config.json (macOS) · %APPDATA%\Claude\claude_desktop_config.json (Windows)

{
"mcpServers": {
"oculix": {
"command": "java",
"args": ["-jar", "/chemin/absolu/oculix-mcp-server.jar", "run"]
}
}
}

Redémarrez Claude Desktop. Les outils apparaissent derrière l’indicateur MCP.

À propos des assistants cloud grand public (ChatGPT, etc.)

Section intitulée « À propos des assistants cloud grand public (ChatGPT, etc.) »

Dix outils en mode par défaut (open) :

OutilAction
oculix_find_imageLocaliser une image à l’écran
oculix_click_imageTrouver une image, puis cliquer dessus
oculix_click_at_pointCliquer à des coordonnées explicites
oculix_exists_imageTester la présence d’une image (sans lever d’échec)
oculix_wait_for_imageAttendre l’apparition d’une image
oculix_type_textTaper une chaîne
oculix_key_comboEnvoyer une combinaison de touches (ex. Ctrl+S)
oculix_find_textLocaliser du texte à l’écran via OCR
oculix_screenshotCapturer l’écran
oculix_read_text_in_regionOCR d’une région et retour du texte

Chaque appel est filtré (ActionGate), signé en Ed25519 et ajouté à un journal JSONL chaîné SHA-256 que vous pouvez rejouer et vérifier avec oculix-mcp-server.jar verify.