u/MarzipanKlutzy9909

Você já teve algum problema com agente de IA fazendo algo que você não esperava?

Pode ser qualquer coisa, mandou um e-mail errado, deletou arquivo, respondeu cliente de forma estranha, gastou crédito à toa, executou uma tarefa que você não pediu.

Me conta aqui o que aconteceu. Estou pesquisando casos reais para entender onde os agentes de IA mais fogem do controle.

(Pode ser algo pequeno também, curiosidade mesmo conta.)

reddit.com
u/MarzipanKlutzy9909 — 3 days ago

Como vocês controlam o que um agente de IA faz no seu nome?

Como vocês controlam o que um agente de IA faz no seu nome?

Como vocês controlam o que um agente de IA faz no seu nome?

Tenho pensado muito nisso nos últimos meses. Agentes de IA estão cada vez mais sendo usados para executar tarefas reais responder e-mail, fazer buscas, mover dados, tomar decisões mas a maioria das implementações não tem nenhum mecanismo de controle para o humano do outro lado.

Alguns problemas que encontrei tentando resolver isso:

  • Como garantir que o agente não fez algo que você não autorizou?
  • Como ter um histórico confiável do que ele fez (que não possa ser alterado)?
  • Como pausar o agente antes de uma ação irreversível sem travar o fluxo inteiro?

Trabalhei num projeto tentando resolver exatamente isso um histórico imutável por cadeia de hash, aprovações com indicador de urgência e regras que bloqueiam automaticamente ações fora do permitido.

Mas quero entender como outras pessoas estão lidando com isso. Vocês confiam cegamente no agente? Têm algum mecanismo de auditoria? Ou ainda estão na fase de "reza pra não dar errado"?

reddit.com
u/MarzipanKlutzy9909 — 3 days ago

Como vocês controlam o que um agente de IA faz no seu nome?

Como vocês controlam o que um agente de IA faz no seu nome?

Tenho pensado muito nisso nos últimos meses. Agentes de IA estão cada vez mais sendo usados para executar tarefas reais responder e-mail, fazer buscas, mover dados, tomar decisões mas a maioria das implementações não tem nenhum mecanismo de controle para o humano do outro lado.

Alguns problemas que encontrei tentando resolver isso:

  • Como garantir que o agente não fez algo que você não autorizou?
  • Como ter um histórico confiável do que ele fez (que não possa ser alterado)?
  • Como pausar o agente antes de uma ação irreversível sem travar o fluxo inteiro?

Trabalhei num projeto tentando resolver exatamente isso um histórico imutável por cadeia de hash, aprovações com indicador de urgência e regras que bloqueiam automaticamente ações fora do permitido.

Mas quero entender como outras pessoas estão lidando com isso. Vocês confiam cegamente no agente? Têm algum mecanismo de auditoria? Ou ainda estão na fase de "reza pra não dar errado"?

reddit.com
u/MarzipanKlutzy9909 — 3 days ago
▲ 6 r/brdev+2 crossposts

Como vocês controlam o que um agente de IA faz no seu nome?

Tenho pensado muito nisso nos últimos meses. Agentes de IA estão cada vez mais sendo usados para executar tarefas reais responder e-mail, fazer buscas, mover dados, tomar decisões mas a maioria das implementações não tem nenhum mecanismo de controle para o humano do outro lado.

Alguns problemas que encontrei tentando resolver isso:

  • Como garantir que o agente não fez algo que você não autorizou?
  • Como ter um histórico confiável do que ele fez (que não possa ser alterado)?
  • Como pausar o agente antes de uma ação irreversível sem travar o fluxo inteiro?

Trabalhei num projeto tentando resolver exatamente isso um histórico imutável por cadeia de hash, aprovações com indicador de urgência e regras que bloqueiam automaticamente ações fora do permitido.

Mas quero entender como outras pessoas estão lidando com isso. Vocês confiam cegamente no agente? Têm algum mecanismo de auditoria? Ou ainda estão na fase de "reza pra não dar errado"?

reddit.com
u/MarzipanKlutzy9909 — 3 days ago
▲ 2 r/LangChain+1 crossposts

Lancei a ORKA — controle e segurança para quem tem um agente de IA trabalhando por ele

Nos últimos meses desenvolvi a ORKA, uma plataforma que coloca o humano no controle quando um agente de IA age no seu nome.

O problema que eu queria resolver

Agentes de IA estão sendo usados para responder e-mails, executar tarefas, fazer buscas, mover dados — mas a maioria das ferramentas não te diz o que exatamente o agente fez, não te deixa aprovar antes que algo irreversível aconteça, e não mantém um histórico que não pode ser alterado.

Isso vale tanto para um dev rodando um agente em produção quanto para alguém sem conhecimento técnico que tem um assistente de IA trabalhando por ele.

O que a ORKA faz

  • Histórico imutável — cada ação do agente é registrada em uma cadeia de hash. Não pode ser apagado ou alterado.
  • Aprovações humanas — para ações importantes, o agente pausa e espera você decidir. Com indicador de urgência visual.
  • Regras de segurança — você define o que o agente pode e não pode fazer. Fora disso, é bloqueado automaticamente.
  • Integração Firecrawl — o agente pode raspar páginas e pesquisar na web usando sua própria chave, com cada ação auditada.
  • MCP Server — funciona direto no Claude Code, Cursor e Windsurf via protocolo MCP.

Stack

FastAPI + PostgreSQL + Redis no backend (Render), Next.js 16 no frontend (Vercel). Pagamentos via Mercado Pago.

Planos

Starter R$ 79/mês com 7 dias grátis, Pro R$ 299/mês, Enterprise sob consulta.

orka.ia.br

reddit.com
u/MarzipanKlutzy9909 — 3 days ago
▲ 3 r/OpenSourceeAI+2 crossposts

Camada de governança ORKA para agentes de IA

>ORKA — governance layer for AI agents

If you're running AI agents in production, you've probably run into at least one of these:

— An agent did something unexpected and you had no way to trace why
— You needed to prove to leadership or compliance what your agents are actually deciding
— A sensitive action happened that should have required human approval first

ORKA solves this. Full audit trail, policy engine, and human-in-the-loop approvals — works with OpenAI, Claude, LangChain, Firecrawl. Instruments on top of your existing stack, no rebuild.

Used by teams in production today. Free plan available.

orka.ia.br

reddit.com
u/MarzipanKlutzy9909 — 4 days ago
▲ 2 r/LangChain+1 crossposts

I built a tool that shows you where your ad budget is actually going — looking for beta testers

Hey everyone,

I've been running paid traffic campaigns for a few years and kept running into the same frustrating problem: Meta says ROAS is 4x, Hotmart says revenue is way lower, and I had no idea which number to trust when making budget decisions.

So I built ClickBoard — a platform that connects your ad spend directly to confirmed revenue, so you can see what's actually making money vs. what just looks like it's making money.

What it does:

  • Connects your ad platforms (Meta, Google, TikTok, LinkedIn, YouTube) to your sales platforms (Hotmart, Kiwify, Eduzz, and others)
  • Shows you real ROAS calculated from actual confirmed sales — not what the ad manager reports
  • Identifies campaigns you should scale vs. campaigns silently draining your budget
  • Alerts you when your ad platform numbers diverge significantly from real revenue
  • Automation rules: auto-pause or adjust budget based on real performance thresholds
  • Attribution across the full customer journey (last-click, first-click, linear, time-decay)
  • Financial dashboard with actual profit, margins, and ROI per campaign

Why I built it:

Most tools either trust the ad platform's numbers (which are biased — their incentive is for you to spend more) or require a dev team to set up. I wanted something that any media buyer could connect in under 5 minutes and immediately see the real picture.

Where it stands:

It's live and working. I've been using it myself. Now I want real users to test it and tell me what's broken, what's missing, and what I should prioritize.

Looking for testers who:

  • Run paid ads (Meta, Google, TikTok) with any budget
  • Sell digital products or physical goods online
  • Are frustrated with the gap between ad platform metrics and actual revenue

If you want early access, drop a comment or DM me. Free to test, no credit card, honest feedback welcome (especially the brutal kind).

Happy to answer any questions about how it works or what's under the hood.

reddit.com
u/MarzipanKlutzy9909 — 4 days ago

Looking for beta testers for ORKA – free AI agent governance layer

Been building AI agents in production and realized there was no good way to audit what they're actually doing, set policies on what they can/can't do, or require human approval before sensitive actions.

Built ORKA to solve this. Works with OpenAI, Claude, LangChain, Firecrawl.

Who I specifically need:

- People running AI agents in production (or trying to)

- Anyone who's had an agent do something unexpected with no way to trace why

- Teams in regulated industries where AI actions need to be auditable

- Devs using LangChain, CrewAI, AutoGen who want visibility without building it themselves

Free tier, no credit card.

I'm not looking for "great job!" — I want to hear "this is annoying and here's why."

orka.ia.br

reddit.com
u/MarzipanKlutzy9909 — 4 days ago
▲ 3 r/LangChain+2 crossposts

Looking for beta testers for ORKA – free AI agent governance layer

Been building AI agents in production and realized there was no good way to audit what they're actually doing, set policies on what they can/can't do, or require human approval before sensitive actions.

Built ORKA to solve this. Works with OpenAI, Claude, LangChain, Firecrawl.

Who I specifically need:
- People running AI agents in production (or trying to)
- Anyone who's had an agent do something unexpected with no way to trace why
- Teams in regulated industries where AI actions need to be auditable
- Devs using LangChain, CrewAI, AutoGen who want visibility without building it themselves

Free tier, no credit card.

I'm not looking for "great job!" — I want to hear "this is annoying and here's why."

orka.ia.br
reddit.com
u/MarzipanKlutzy9909 — 4 days ago
▲ 2 r/LangChain+1 crossposts

I built an AI infrastructure startup and sometimes I feel like no one around me understands what that means.

I built an AI infrastructure startup and sometimes I feel like no one around me understands what that means.

I started Orka while still working as a backend developer. I spent years studying distributed systems, software architecture, and building APIs that nobody saw. Today I work full-time on the company, but when people ask what I do, I say "I work with AI" and they assume I'm just another person building a chatbot.

Orka is an operational control layer for AI agents. Basically: companies are deploying autonomous agents to execute critical tasks — financial transactions, customer support, infrastructure access — with zero auditing. We solve that. Governance, traceability, real-time interception of high-risk actions.

The product is in open beta, free. We already have companies using it. But when I tell friends and family, I always get the same blank silence from people who didn't understand a word.

Sometimes I wonder if I should have stayed in a more "readable" job. But then I look at what we're building — an infrastructure layer that will be required for any company operating AI at scale — and it gets hard to ignore what's in front of us.

Has anyone else been through this? Building something you know is real, but the world doesn't have the vocabulary for it yet?

reddit.com
u/MarzipanKlutzy9909 — 5 days ago

Looking for beta testers for ORKA – free AI agent governance layer, alternative to building your own audit/approval system

Hey, looking for people to actually use ORKA and tell me what's broken or missing.

What it does: sits between your AI agent and the world — full audit trail of every action, policy engine to block unauthorized behavior, human-in-the-loop approvals before sensitive operations, real-time risk alerts. Works with OpenAI, Claude, LangChain, Firecrawl.

Who I specifically need:
- People running AI agents in production (or trying to)
- Anyone who's had an agent do something unexpected and had no way to trace why
- Devs using LangChain, CrewAI, AutoGen who want visibility without building it themselves
- Teams in regulated industries where AI actions need to be auditable

Free tier is the main focus right now.

I'm not looking for "great job!" — I want to hear "this is annoying and here's why." That's more useful.

orka.ia.br
reddit.com
u/MarzipanKlutzy9909 — 5 days ago

ORKA – Governance layer for AI agents (beta, free access)

Been building AI agents in production and kept running into the same problem: no visibility into what they're actually doing, no way to set policies, no human approval before sensitive actions.

Built ORKA to solve this — audit trail, policy engine, risk alerts, and human-in-the-loop approvals for any AI agent stack.

Looking for beta testers and feedback. Free access, no credit card.

Would love to hear if anyone else has run into this problem.
reddit.com
u/MarzipanKlutzy9909 — 5 days ago

Criei uma camada de auditoria e governança para agentes de IA – verificações de políticas, fluxos de aprovação humana e registro de auditoria imutável.

Disclosure: I'm the developer of this project.

AI agents are taking actions without any oversight – calling APIs, writing data, triggering workflows. Most teams have zero visibility into what's actually happening.

I built ORKA to fix that.

ORKA sits between your agents and the outside world:

→ Every action goes through a policy check before executing

→ High-risk actions pause and wait for human approval

→ Everything is logged in a cryptographically chained audit trail

→ Real-time dashboard with risk scores per agent

It supports MCP, A2A, REST, and custom agent protocols.

Currently in private beta – free to use, no credit card required.

Search "ORKA governance AI agents" on GitHub or "orka.ia.br" to find it.

Would love feedback from anyone building with AI agents. What governance/visibility features are you missing today?

reddit.com
u/MarzipanKlutzy9909 — 5 days ago