Research Article

Statistical and Lexical Analysis for Semi-automatic Extraction of Relevant Information from Legal Documents

F. Amato
Dipartimento di Informatica e Sistemistica, Universita di Napoli Federico II, via Claudio 21, 80125, Napoli, Italy

R. Canonico
Dipartimento di Informatica e Sistemistica, Universita di Napoli Federico II, via Claudio 21, 80125, Napoli, Italy

A. Mazzeo
Dipartimento di Informatica e Sistemistica, Universita di Napoli Federico II, via Claudio 21, 80125, Napoli, Italy

A. Picariello
Dipartimento di Informatica e Sistemistica, Universita di Napoli Federico II, via Claudio 21, 80125, Napoli, Italy

The bureaucratic domain and the legal one, in particular, are characterized by a huge amount of information. In order to opportunely manage the knowledge embedded within documents for structuring, indexing and retrieval purposes, a suitable statistical-lexical approach is required for a quick identification of relevant and peculiar information. The main goal of this study is to describe two integrated strategies for semi-automatic extraction of significant and peculiar terms, starting from a corpus of documents belonging to legal domain. The extracted lexicon will provide a basis for the construction of a conceptual system to be used as knowledge base supporting the semantic processing of documents.

PDF Fulltext XML References Citation

How to cite this article

F. Amato, R. Canonico, A. Mazzeo and A. Picariello, 2011. Statistical and Lexical Analysis for Semi-automatic Extraction of Relevant Information from Legal Documents. Journal of Applied Sciences, 11: 639-646.

DOI: 10.3923/jas.2011.639.646

URL: https://scialert.net/abstract/?doi=jas.2011.639.646

Journal of Applied Sciences

Article Trend

Total views 1107

Authors

F. Amato

R. Canonico

A. Mazzeo

A. Picariello

Keywords

Research Article

Statistical and Lexical Analysis for Semi-automatic Extraction of Relevant Information from Legal Documents

How to cite this article

Related Articles

Leave a Comment