L'indicizzazione è intesa come il processo di descrizione dettagliata del contenuto di una scrittura o di un documento, principalmente estraendo parole chiave che rappresentano adeguatamente il testo. Il suo utilizzo principale è quando i file devono essere recuperati o cercati all'interno di un sistema di recupero, organizzazione o magazzino, per ridurre i tempi di ricerca e diffusione. È moderato secondo lo standard ISO 5963, imposto nel 1985. Nello specifico, viene elaborata una sorta di indice che aiuta per ogni documento, che non solo contiene parole di grande importanza all'interno del contenuto, ma include anche dei riassunti di esso, nonché che il guastoo analisi dell'argomento. Allo stesso modo, è governato da una policy, che può variare a seconda dell'istituzione che lo impiega, sebbene queste siano sempre ritratte in appositi manuali per loro.
Nell'As in molti processi, compresa la classificazione e l'analisi dei documenti, si compone di più fasi, in quanto vengono lette a fondo il problema che si trova all'interno del documento; scegli i punti essenziali sull'argomento; scomporre i concetti scelti con parole specifiche o inserirli in un vocabolario controllato; infine, si stabiliscono collegamenti tra i termini finalmente estratti dal testo. L'indicizzazione libera è quindi il processo in cui viene presentato un sommario con i termini chiave di un documento, con la differenza che questo, in fase di collocazione sotto un vocabolario controllato, non viene utilizzato, ma vengono proposte le parole dal soggetto che svolge l'attività o sono tratti direttamente dal documento.