Tatoeba to otwarta, wielodostępna baza danych zdań selektywnych (różni się ona od zwykłego słownika lub tłumacza tym, że nie tłumaczy pojedynczo poszczególnych słów, ale zawiera obszerną, stale rozszerzającą się bazę zdań przetłumaczonych przez rodzimych użytkowników). Nazwa projektu pochodzi od japońskiego słowa tatoeba (例 え ば), co oznacza na przykład. Strona jest otwarta dla wszystkich internautów i daje im możliwość tłumaczenia zdań między znanymi językami (administratorzy zalecają tłumaczenie wyłącznie ze znanych języków na frazy, które brzmią jak najbardziej naturalnie), komentowanie sugestii dotyczących ich poprawek i dodawania wersji dźwiękowej. Chociaż tłumaczenia są wykonywane między dwoma językami, tłumaczenia pośrednie są również widoczne przy każdym zdaniu. Tatoeba została założona przez Trang Ho w 2006 roku. Początkowo wspierał projekt na serwerze SourceForge o nazwie “multilangdict”. Obecnie prowadzi stronę z Allanem Simonem, który dołączył w 2009 roku i jest głównym twórcą strony. Dane zgromadzone przez serwer są dostępne bezpłatnie na licencji Creative Commons.
stan na dzień 8 marca 2015 r. Tatoeba zawiera ponad 3700 000 zdań w 151 oficjalnych i kilku nieoficjalnych językach, w tym co najmniej 8 sztucznych języków ze średnim wzrostem liczby 2000-2700 zdań dziennie. Większość ofert jest dostępna w języku angielskim (który jest najczęściej używany jako podstawa do tłumaczenia na inne języki), esperanto, hiszpański niemiecki, francuski i hiszpański. Obecnie w języku polskim dostępnych jest ponad 78 000 zdań, co daje 14 miejsce na liście najpopularniejszych języków na stronie. Szczegółowe informacje na ten temat są dostępne na oficjalnej stronie portalu statystycznego. Interfejs jest dostępny w 20 językach. Dostępne są procedury tworzenia kolejnej wersji językowej interfejsu, a także dodawania języka do przetłumaczonej listy. Witryna jest dostępna dla niezarejestrowanych użytkowników. Każdy ma możliwość wyszukiwania i odczytywania zdań, ale dopiero po zalogowaniu można dodawać lub edytować tłumaczenia zdań (edycja jest możliwa tylko, jeśli jesteś właścicielem oferty lub odbierasz ją komuś), tylko użytkownicy mogą wybrać usunięte. Istnieją transfery bezpośrednie i pośrednie, co sugeruje potencjalne ryzyko błędu w przypadku transferów pośrednich. Propozycje są oznaczone zgodnie z ich charakterem, własnymi imionami lub długością. Odnotowano również propozycje, których tłumaczenie jest oczywiście nieprawidłowe. Tylko wybrani użytkownicy mogą być oznaczani.