An efficient empirical method for file-level deduplication

Yu.R. Pigovsky

Abstract


Вдосконалено метод пошуку дублікатів контенту у файловій системі на основі емпіричного правила доцільності хешування. Правило створено на основі побудови математичних сподівань тривалості процедур хешування і попарного порівняння файлів. Проведено експериментальні дослідження методу.

Prombles in programming 2014; 4: 26-32


References


Bonwick J. ZFS Deduplication. – 2009. https://blogs.oracle.com/bonwick/entry/zfs_dedup

Lopez A. fdupes(1) – Linux man page http://linux.die.net/man/1/fdupes

Шеховцов В.А. Операційні системи // Захист інформації в операційних системах. – К.: Видавнича група BHV, 2005. – Розд. 18.

– С. 471–472.

Кнут Д.Э. Искусство программирования, том 1. Основные алгоритмы, 3-е изд.: Пер. с англ.: Уч. пос. – М.: Издательский дом

"Вильямс", 2000. – 720 с.

Chacon S. Pro Git. – Apress, 2009.

Mordvinova O. I/O Benchmarking of Data Intensive Applications / Olga Mordvinova, Thomas Ludwig, Christian Bartholomä //

Проблеми програмування. – К.; 2010. – N 2–3. Спец. випуск. – С. 107–115.


Refbacks

  • There are currently no refbacks.