1. Propósito e Escopo
Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Agente de IA "Análise de Condição de Livros", uma solução de automação projetada para avaliar a condição física dos livros a partir de imagens e sugerir reparos ou substituições quando necessário. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.
O objetivo principal é transformar o input de imagens dos livros em relatórios automáticos, que detalham os danos e sugerem ações corretivas, reduzindo a subjetividade e imprecisão da avaliação manual.
2. Contexto e Problema
Cenário Atual
A avaliação da condição física dos livros é realizada manualmente, o que resulta em subjetividade e imprecisão. Além disso, não há um registro sistemático sobre a necessidade de reparos ou substituições, o que pode levar ao desgaste progressivo dos livros sem intervenções preventivas.
Problemas Identificados
- Subjetividade: A avaliação manual é subjetiva e pode variar de acordo com a percepção de cada avaliador.
- Falta de Registro: Não há um sistema automatizado para registrar a condição dos livros e a necessidade de intervenções.
- Desgaste Progressivo: Livros podem se deteriorar sem que intervenções preventivas sejam realizadas a tempo.
3. Impactos Esperados
A implementação deste agente de IA visa alcançar os seguintes resultados:
- Precisão na Avaliação: Aumentar a precisão na avaliação da condição dos livros.
- Automatização do Registro: Criar um registro sistemático e automatizado das condições dos livros.
- Intervenções Preventivas: Facilitar intervenções preventivas ao identificar danos precocemente.
4. Visão Geral da Solução
O agente de IA para análise de condição de livros utiliza visão computacional para analisar imagens dos livros, identificar danos e criar relatórios automáticos sobre o estado dos livros. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na avaliação e manutenção do acervo de livros.
A solução consiste em um fluxo de automação composto por 2 agentes de IA. O processo inicia com a análise das imagens dos livros e termina com a geração de um relatório detalhado com sugestões de reparos ou substituições.
A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.
| Agentes | Função Principal |
|---|---|
Agente de Extração de Dados de Imagem de Livros (RF 1)
| Extrair informações sobre a condição física dos livros a partir de imagens. |
Agente de Relatórios e Ações Corretivas para Livros (RF 2)
| Gerar relatórios automáticos e sugerir ações corretivas para os livros analisados. |
5. Protótipos
Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.
6. Requisitos Funcionais
RF 1. Agente de Extração de Dados de Imagem de Livros
1.1 Tarefa do Agente
Extrair informações sobre a condição física dos livros a partir de imagens.
1.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo imagens de livros em formato JPEG ou PNG. Seu objetivo é analisar cada imagem para identificar a condição física do livro.
# 2. Objetivo
Utilizar visão computacional para analisar as imagens e identificar danos como rasgos, manchas e páginas soltas, classificando a condição geral do livro.
# 3. Regras que você deve seguir para gerar sua resposta
- Analise cada imagem de livro individualmente, identificando danos como rasgos, manchas e páginas soltas.
- Classifique a condição geral do livro como ótimo, bom, regular ou ruim, com base na quantidade e gravidade dos danos identificados.
- Sinalize imagens de baixa qualidade ou pouco iluminadas para nova captura, garantindo a precisão na análise dos danos.
# 4. Exemplo de Output que você deve produzir
{"danos_identificados": ["rasgos", "manchas", "páginas soltas"], "condicao_geral": "regular"} 1.3 Configurações do Agente
1.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de imagens dos livros via API. Na fase de testes, o fluxo será iniciado pelo envio manual das imagens, que serão enviadas para o agente diretamente por upload na interface da Prototipe AI, para acelerar o processo de validação.
- Tipo do input: O input inicial para o fluxo são imagens dos livros, que serão analisadas para identificar a condição física dos mesmos.
-
Formatos Suportados: Esse agente deve ser capaz de receber imagens nos formatos:
.jpeg,.png. - Número de caracteres esperado: Este agente não processa texto, mas sim imagens, portanto, não há uma estimativa de caracteres aplicável.
1.3.2 Especificação do Output
- Formato de output: O output deve ser um objeto JSON contendo os danos identificados e a condição geral do livro.
-
Exemplo de Estrutura de Output:
{"danos_identificados": ["rasgos", "manchas", "páginas soltas"], "condicao_geral": "regular"} - Número de caracteres esperado: O JSON de output terá um tamanho aproximado de 200 caracteres.
1.3.3 Parâmetros de Geração
- Modelo: Gemini Vision
- Temperatura: 0.5
1.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
1.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Relatórios e Ações Corretivas para Livros (RF 2).
1.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Relatórios e Ações Corretivas para Livros (RF 2).
RF 2. Agente de Relatórios e Ações Corretivas para Livros
2.1 Tarefa do Agente
Gerar relatórios automáticos e sugerir ações corretivas para os livros analisados.
2.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo dados sobre danos e condição geral dos livros extraídos das imagens. # 2. Objetivo Elaborar relatórios detalhados que incluam todos os danos identificados e a condição geral de cada livro, sugerindo ações corretivas específicas. # 3. Regras que você deve seguir para gerar sua resposta - Elabore um relatório detalhado que inclua todos os danos identificados e a condição geral de cada livro. - Sugira ações corretivas específicas, priorizando reparos urgentes para danos severos e propondo substituições quando necessário. - Classifique as sugestões de ações corretivas em categorias de urgência: alta, média e baixa, para facilitar a priorização das intervenções. # 4. Exemplo de Output que você deve produzir Relatório em markdown com sugestões de reparos ou substituições.
2.3 Configurações do Agente
2.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
- Tipo do input: Este agente deve ser apto a receber dados sobre danos e condição geral dos livros, extraídos das imagens pelo agente anterior.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json(JSON). - Número de caracteres esperado: O JSON de input terá um tamanho aproximado de 200 caracteres.
2.3.2 Especificação do Output
- Formato de output: O output deve ser um relatório em formato Markdown que inclua todos os danos identificados, a condição geral de cada livro e as sugestões de ações corretivas.
-
Exemplo de Estrutura de Output:
Relatório em markdown com sugestões de reparos ou substituições.
- Número de caracteres esperado: O relatório final deve ter um tamanho estimado em torno de 1.000 caracteres.
2.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.7
2.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
2.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.
2.3.6 Regras de Orquestração e Transição
A execução deste agente finaliza o fluxo. O relatório gerado é o resultado que deve ser disponibilizado ao usuário.