L’Italia del primo millennio a.C. ci mette in presenza di una grande quantità di lingue, senza poi considerare quelle che, nel corso stesso di questo periodo, vi furono introdotte dall'esterno, attraverso la colonizzazione greca e quella semitica (Fenici e Punici hanno lasciato testimonianze della loro presenza in Sicilia e in Sardegna). Queste parlate differenti appartengono a loro volta a famiglie diverse: il primo passo che si impone a chi le voglia studiare consiste nel classificarle, nello stabilire rapporti di parentela fra loro.
A proposito dell'appartenenza a famiglie differenti, la maggioranza delle lingue europee (il greco, il latino – e le lingue che ne sono derivate –, le lingue germaniche, celtiche, slave, baltiche) appartengono alla grande famiglia delle lingue dette indoeuropee (come in Asia l’iranico, il sanscrito, l’armeno o l’ittita). Tutte queste lingue provengono quindi da un comune antenato, e ciò spiega le somiglianze che si osservano fra loro, al di là della maniera in cui le lingue figlie hanno potuto evolversi e divergere rispetto alla lingua madre. Le parlate indoeuropee si sono diffuse in Europa fin da epoche precedenti le prime testimonianze scritte; quando queste compaiono (in Italia, verso il VII secolo a. C.), ci mostrano dei linguaggi indoeuropei stabilmente radicati e già nettamente differenziati, al punto di lasciar sussistere soltanto piccole isole di linguaggi pre-indoeuropei (com'è il caso del basco, presente ancora oggi nell'Europa occidentale).
Come per l'Europa, anche per quanto riguarda l’Italia antica, esiste dunque un criterio di distinzione fondamentale: accanto alle lingue indoeuropee, restavano infatti ben radicati linguaggi che non appartengono a questo ceppo linguistico. È il caso innanzitutto dell’etrusco, conosciuto attraverso parecchie migliaia d’iscrizioni (costituite però quasi tutte soltanto da brevi enunciati, in cui predominano i nomi propri). Tali documenti si estendono dal 700 a. C. circa all'inizio della nostra era. Si può affermare che non si tratta di una lingua indoeuropea, anche se ha assorbito parole greche e degli idiomi italici.
Nel resto d’Italia predominavano le lingue indoeuropee. All'interno di questa categoria bisogna però ancora distinguere numerosi gruppi: la grande famiglia indoeuropea si suddivide infatti in vari rami, che devono le loro caratteristiche a evoluzioni e a innovazioni divergenti rispetto allo stadio iniziale. Ad esempio certe occlusive spiranti che appartenevano al fondo antico dell’indoeuropeo come *bh e *dh si sono trasformate diversamente nelle parlate del gruppo celtico e in quelle del gruppo italico (che sono quelle che ci interessano per l’Italia): ovvero nelle lingue celtiche sono diventate, in ogni caso, occlusive sonore b e d, mentre nelle lingue italiche, per lo meno in posizione iniziale in una lingua come il latino (e il venetico), hanno preso la forma della spirante sorda f.
Un tale differenza può considerarsi come un principio di classificazione che permette di distinguere in Italia lingue appartenenti al gruppo detto italico e lingue derivanti da altri gruppi (come quello celtico appunto). Sono di famiglia indoeuropea ma non italiche: il messapico e le lingue del gruppo celtico che, è giusto notare, si trovano in posizione periferica e quindi vanno piuttosto considerate come il risultato del diffondersi nella penisola di ceppi linguistici esterni. In Italia si afferma innanzitutto il dominio di un ramo particolare delle lingue indoeuropee, che è stato chiamato per ciò stesso italico (sebbene talvolta si tenda a riservare l’uso del termine «italico» al solo gruppo osco-umbro). A questo ramo, appartengono lingue come il latino, il gruppo osco-umbro e il venetico.
Cartina delle principali lingue italiche del I millennio a.C.