Оптимізація алгоритму побудови невід’ємної матричної факторизації у задачах обробки текстів природною мовою із вико-ристанням графічних процесорів

O.O. Marchenko, V.K. Kisenko, I.O. Berezan

Abstract


У роботі представлена реалізація алгоритму побудови невід’ємної матричної факторизації у задачах обробки текстів природноїю мовою із використанням графічних процесорів. Збільшення швидкодії досягається за рахунок використання паралельної архітектури сучасних графічних процесорів. Отримано значне прискорення початкового алгоритму (більш ніж на один порядок).
An implementation of the non-negative matrix factorization algorithm for the purpose of text mining on graphics processing units is presented. Performance gains of more than one order of magnitude are obtained.


References


Lee D.D. and Seung H.S. Algorithms for Non-Negative Matrix Factorization // NIPS, 2000.

Harish P. and Narayanan P.J. Accelerating Large Graph Algorithms on the GPU using CUDA. Proc.14th Intl.Conf.on High Performance Computing (HiPC'07). – 2007.

NVIDIA, CUDA, URL: http://www.nvidia.com/

Khronos Group. OpenCL. URL: http://www.khronos.org/opencl/

Agullo E. et al. Numerical Linear Algebra on Emerging Architectures: The PLASMA and MAGMA projects // J.Phys.: Conf.Ser. – 2009. –Vol.180.

Rupp K. et al. ViennaCL - A High Level Linear Algebra Library for GPUs and Multi-Core CPUs. Proc. Intl. Workshop on GPUs and Scientific Applications (GPUScA 2010). – 2010. – P. 51– 56.

Xu R. and Wunsch D., Survey of Clustering Algorithms. IEEE Trans.on Neural Networks. – 2005. – Vol.16. – P. 645–678.

Deerwester S. et al. Indexing by Latent Semantic Analysis // Journal of the American Society for Information Science. – 1990, Vol. 41. – P. 391–407.

Xu W. et al. Document Clustering Based on Non-Negative Matrix Factorization. Proc. 26th Intl. Conf. Research and Development in Information Retrieval. – 2003. – P. 267 – 273.

Pauca V. et al. Text Mining Using Non-Negative Matrix Factorizations. Proc.4th SIAM Intl.Conf.Data Mining. – 2004.


Refbacks

  • There are currently no refbacks.