EVA é o módulo principal de um bot para RPG, projetado para facilitar a interação entre jogadores e o ambiente do jogo, utilizando transcrição de voz para texto e integração com IA generativa. O módulo se concentra na comunicação interativa e em melhorar a experiência de narrativa nos jogos de RPG.
- Conversão de voz para texto e vice-versa.
- Integração com IA generativa para respostas em tempo real.
- Configurações avançadas para reconhecimento de diferentes personagens e jogadores.
Para construir a imagem Docker localmente, execute:
docker build -t amaralfelipe1522/eva-stt-tts:2.0 .
Para iniciar o container com suporte para dispositivos de áudio e teclado, utilize o seguinte comando:
xhost +local:docker && docker run -it --rm --name eva\
--device /dev/snd \
--group-add audio \
-e DISPLAY=$DISPLAY -v /tmp/.X11-unix:/tmp/.X11-unix \
-e PULSE_SERVER=unix:/run/user/$(id -u)/pulse/native \
-v /run/user/$(id -u)/pulse/native:/run/user/$(id -u)/pulse/native \
amaralfelipe1522/eva-stt-tts:2.0
Este comando configura o acesso aos dispositivos necessários para captura e reprodução de áudio, bem como a interação com o sistema de som.
Pré-requisitos: Instalação de algumas dependências essenciais.
A instalação do FFmpeg pode variar conforme o sistema operacional. Abaixo estão os métodos de instalação em Windows e Ubuntu.
-
Windows (Método 1):
- Baixe os binários do FFmpeg no site oficial: ffmpeg.org/download.html;
- Extraia o conteúdo para um diretório de sua escolha;
- Adicione o diretório ao PATH do sistema nas configurações de ambiente do Windows para acessá-lo de qualquer termina.
-
Windows (Método 2):
- Use o Windows Package Manager:
winget install "FFmpeg (Essentials Build)"
- Use o Windows Package Manager:
-
Ubuntu:
sudo apt install ffmpeg sudo apt install portaudio19-dev python3-dev
Essas dependências são necessárias para que o EVA possa capturar e processar áudio, além de integrar recursos em Python que exigem compilação.
- Aprimoramento dos PROMPTs:
- Melhorar respostas relacionadas a rolagem de dados.
- Refinar o entendimento da IA para diferenciar jogadores, personagens e companheiros de forma clara.
- Otimização dos Logs:
- Criar logs detalhados e organizar o terminal para melhor leitura.
- Otimização da Imagem Docker:
- Reduzir o tamanho da imagem Docker para melhorar desempenho e uso de recursos.
- Armazenamento de Sessões no MongoDB:
- Armazenar o histórico de conversação para retomar sessões anteriores e enriquecer as interações futuras.
- Criação de Microserviço para Banco de Dados Relacional:
- Desenvolver um microserviço separado para gerenciar as interações com um banco de dados relacional.