Subword-Based Text Retrieval - Citegraph

Paper Info

Title
Subword-Based Text Retrieval

Abstract
Document retrieval in languages with a rich and complex morphology 驴 particularly in terms of derivation and (single-word) composition 驴 suffers from serious performance degradation with the stemming-only query-term-to-text-word matching paradigm. We propose an alternative approach in which morphologically complex word forms are segmented into relevant subwords (such as stems, prefixes, suffixes), and subwords constitute the basic unit for indexing and retrieval. We evaluate our approach on a large biomedical document collection.

Year	DOI	Venue
2003	10.1109/HICSS.2003.1174249	HICSS
Keywords	Field	DocType
complex word form,subword-based text retrieval,large biomedical document collection,complex morphology,serious performance degradation,basic unit,alternative approach,document retrieval,stemming-only query-term-to-text-word,relevant subwords,information retrieval,text analysis,indexing	Information retrieval,Computer science,Document clustering,Prefix,Artificial intelligence,Relevance (information retrieval),Natural language processing,Document retrieval,Vector space model,Concept search,Word processing,Visual Word	Conference
ISBN	Citations	PageRank
0-7695-1874-5	2	0.46
References	Authors
14	3

Authors (3 rows)

Cited by (2 rows)

References (14 rows)

Name	Order	Citations	PageRank
Udo Hahn	1	32	4.80
Martin Honeck	2	21	2.62
Stefan Schulz	3	29	5.15

1