<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Rag on Cesar Gimenes</title><link>https://crg.eti.br/pt-br/tags/rag/</link><description>Recent content in Rag on Cesar Gimenes</description><generator>Hugo -- gohugo.io</generator><language>pt-br</language><managingEditor>crg@crg.eti.br (Cesar Gimenes)</managingEditor><webMaster>crg@crg.eti.br (Cesar Gimenes)</webMaster><lastBuildDate>Sat, 06 Jun 2026 11:57:59 -0300</lastBuildDate><atom:link href="https://crg.eti.br/pt-br/tags/rag/index.xml" rel="self" type="application/rss+xml"/><item><title>Text chunker com sobreposição para pipelines RAG</title><link>https://crg.eti.br/pt-br/post/text_chunker/</link><pubDate>Sat, 06 Jun 2026 11:57:59 -0300</pubDate><author>crg@crg.eti.br (Cesar Gimenes)</author><guid>https://crg.eti.br/pt-br/post/text_chunker/</guid><description>&lt;p>Em pipeline de RAG (&lt;em>Retrieval-Augmented Generation&lt;/em>) o primeiro passo é quase sempre o mesmo: pegar um texto grande e quebrar em pedaços antes de vetorizar. Os pedaços não podem ser grandes demais, porque o modelo tem limite de contexto, nem pequenos demais, porque aí o embedding perde semântica. E precisam ter sobreposição entre vizinhos, senão uma resposta que cai bem na fronteira fica espremida entre dois chunks e o retriever erra.&lt;/p></description></item></channel></rss>