Файл /usr/share/dict/words является одним из тех компонентов операционных систем на базе UNIX и Linux, которые знакомы многим разработчикам и пользователям. Этот список слов служит различным программам в качестве источника словарных данных: проверкам орфографии, генераторам случайных слов и многим другим инструментам. Несмотря на его кажущуюся простоту, многие задаются вопросом, кто и как поддерживает этот файл, а также куда обращаться с предложениями по исправлению ошибок или добавлению новых слов. Исторически файл /usr/share/dict/words пришёл из мира UNIX. Включённый в многие UNIX-подобные системы, он представляет собой текстовый файл с огромным перечнем английских слов, каждое из которых расположено на отдельной строке.
Основное назначение файла – служить удобным источником для словарных данных, применяемых во множестве программ. Тем не менее, содержание этого файла не является стандартизированным или официально утверждённым, и его актуальность, качество и полнота могут отличаться между разными дистрибутивами и версиями ОС. Вопрос поддержки /usr/share/dict/words достаточно сложен, поскольку этот файл не поддерживается одним централизованным проектом. Его содержимое часто берётся из сторонних источников, а некоторые дистрибутивы распространяют свои версии этого списка. Например, в системах на основе Debian и Ubuntu этот файл создаётся при помощи пакета wamerican или аналогичных, который, в свою очередь, базируется на словарях, распространяемых GNU или другими сообществами свободного программного обеспечения.
Одним из важных источников для слова в таких словарях является проект GNU, а именно репозиторий miscfiles, находящийся под управлением Savannah GNU. Один из обсуждений на популярных площадках для разработчиков и энтузиастов, таких как Hacker News, упоминал адрес https://savannah.gnu.org/projects/miscfiles/ в качестве места хранения словарей и слов для /usr/share/dict/words. Эти словари регулярно обновляются волонтёрами и разработчиками, но тем не менее, это не единственный источник, и различные операционные системы могут использовать альтернативные версии или дополнения.
Для того чтобы сообщить о найденных ошибках или добавить новые слова, пользователей обычно направляют именно к проектам, разрабатывающим словари. Например, для пакета wamerican пользователей просят отправлять исправления или предложения через систему баг-трекера Debian или напрямую в репозиторий GNU miscfiles, если таковой используется. Важно понимать, что десятки тысяч слов в списке — это результат коллективной работы, и многие из них могут быть спорными или устаревшими. Сообщение об ошибках влияет на качество и пригодность словаря. При обнаружении опечаток, отсутствующих слов или устаревших форм полезно изучить документацию или страницу проекта, отвечающего за словарь в вашем дистрибутиве, чтобы понять стандарты подачи предложений.
В некоторых случаях участие сообщества и волонтёров жизненно важно для поддержания релевантности файла /usr/share/dict/words. Если важно быстро скорректировать словарь на локальном компьютере, есть возможность редактировать файл вручную, однако это не всегда удобно или желательно. Лучший подход – участие в официальных проектах, обмен с другими пользователями и разработчиками, а также помощь в тестировании новых версий словарей. Многие вендоры и дистрибутивы ценят обратную связь от сообщества, поскольку это позволяет поддерживать инструменты и программы в актуальном и надёжном состоянии. Кроме того, существуют сторонние проекты и ресурсы, которые предоставляют альтернативные, более современные или расширенные списки слов.
Одним из таких является словарь проекта SCOWL (Spell Checker Oriented Word Lists), который также может быть использован для обновления и расширения /usr/share/dict/words. Он включает множество вариаций слов, с учётом американского и британского вариантов английского языка, а также специализированные термины и диалекты. В итоге, пользователю, желающему внести предложение или исправление в /usr/share/dict/words, стоит начать с изучения системы управления пакетом словаря, установленного на его операционной системе, и связаться с соответствующим проектом. Также полезно отслеживать специализированные форумы и площадки, на которых обсуждаются вопросы поддержки словарей. Помнить, что без участия сообщества такие проекты не смогут развиваться и улучшаться.