Dostupné právne zdroje, ktoré sa majú spracovať zahŕňajú dokumenty v slovenčine, angličtine a francúzštine, pričom rôzne metódy extrakcie atribútov sú vhodné pre rôzne typy dokumentov. Výskumný tím plánuje vytvoriť sémantický model (RDF, OWL) na jednotnú reprezentáciu objektov, atribútov a vzťahov v podobe sémantického grafu. Hoci Súdny dvor EÚ už takú reprezentáciu implementoval, na Slovensku zatiaľ neexistuje. Nevýhodou tohto prístupu je pomalé vyhľadávanie, preto tím preskúma alternatívne formy ukladania, ktoré minimalizujú túto nevýhodu pomocou RDMS, NoSQL databáz a fulltextového stroja. Cieľom je dotazovací systém, ktorý by umožňoval rozšírené vyhľadávanie v súbore právnych dokumentov pomocou extrahovaných atribútov a kombinácie fulltextového vyhľadávania alebo vyhľadávania pomocou všeobecných výrazov. Výsledkom tohto vyhľadávania by bol súbor právnych dokumentov spolu s atribútmi, ktoré sa z nich extrahujú.
