Джонс, Карен Спарк
Карен Спарк Джонс | |
---|---|
Дата рождения | 26 августа 1935 |
Место рождения | Хаддерсфилд, Йоркшир |
Дата смерти | 4 апреля 2007 (71 год) |
Место смерти | Уиллингем |
Страна | Великобритания |
Научная сфера | Информатика |
Место работы | Компьютерная лаборатория Кембриджского университета |
Альма-матер | Кембриджский университет |
Научный руководитель | Ричард Брейтуэйт |
Известна как | Создатель концепции IDF |
Награды и премии | ACL Lifetime Achievement Award, BCS Lovelace Medal, ACM-AAAI Allen Newell Award, ACM SIGIR Salton Award, American Society for Information Science and Technology’s Award of Merit |
Сайт | cl.cam.ac.uk/archive/ksj… |
Карен Спарк Джонс (член британской академии ; 26 августа 1935 — 4 апреля 2007) британский учёный в области информатики.
Спарк внесла значительный вклад в две отдельные области: информационный поиск (ИП) и обработка естественного языка (ОЕЯ). В последние годы своей жизни она занималась интеграцией этих направлений в основные блок-схемы ИИ. Её наиболее важным вкладом является создание концепции учёта весов слов обратной частоты документа (IDF), которую она описала в статье в 1972-м году . На сегодняшний день IDF используется во многих поисковых системах, как правило, в составе схемы TF-IDF.
Биография
Происхождение
Карен Спарк Джонс [1][2] родилась в городе Хаддерсфилде графства Йоркшир в Англии. Её отцом был Оуэн Джонс — преподаватель химии, а матерью — норвежка Ида Спарк, которая переехала в Великобританию во время Второй мировой войны. Оуэн и Ида покинули Норвегию на одном из последних кораблей после немецкого вторжения в 1940 году.[3]
Карьера
Карен Спарк Джонс обучалась в гимназии Хаддерсфилд, а затем в Кембриджском колледже с 1953 по 1956 года. Там изучала историю, но на последнем году обучения увлеклась философией (тогда она называлась Моральные науки (англ. Moral Sciences)) и после окончания обучения приняла приглашение Маргарет Мастерман[англ.][4] на вступление в языковой исследовательский отдел Кембриджского университета (ЯИОКУ). Прежде чем перейти к исследовательской работе в области информатики, она недолго проработала учителем в школе.
Статья, написанная Спарк совместно с Мастерман и Нидхемом, и опубликованная в 1958 году, называется «Аналогия между машинным переводом и поиском в библиотеке»[5]. В 1968 году Спарк перевели из ЯИОКУ в компьютерную лабораторию при Кембриджском университете[англ.], к тому времени она уже 3 года была сотрудником Ньюнхем-колледжа[англ.], а затем стала членом Лондонского королевского общества. Там она начала свою карьеру в области ИП, в которой она стала мировым авторитетом.
До того, как Спарк была переведена в Кембриджский университет, она написала диссертацию на тему «Синонимия и семантическая классификация» в 1964 году при Кембриджском языковом исследовательском подразделении под руководством Маргарет Мастерман и её мужа, философом Ричардом Брейтуэйтом[англ.]. Эта работа сильно опережала своё время и была опубликована лишь двадцать лет спустя в статье по теме ИИ в Эдинбургском университете. На самом деле, это было первое применение статистических методов кластеризации для лексических данных. Это было амбициозной попыткой создать некоторое представление о примитивных понятиях машинного перевода на эмпирической основе. Алгоритмы, которые она использовала, были из теории о «сгустках» («Theory of Clumps»). Они были разработаны и использованы её мужем Роджером Нидхемом в его дипломной работе по автоматической классификации, и те, которые она использовала, когда начала работать в компьютерной лаборатории при Кембриджском университете. Основным источником вдохновения для Спарк был её муж Роджер Нидхем и её руководитель Маргарет Мастерман[4].
Концепция IDF
Карен Спарк Джонс внесла значительный вклад в области: ИП и ОЕЯ.[6], а также создала концепцию учёта весов слов обратной частоты документа (IDF), которую она описала в статье в 1972-м году.[7] IDF (inverse document frequency — обратная частота документа) — инверсия частоты, с которой некоторое слово встречается в документах коллекции. Учёт IDF уменьшает вес широкоупотребительных слов. Для каждого уникального слова в пределах конкретной коллекции документов существует только одно значение IDF.
Проводится ежегодная лекция «British Computer Society», названная в её честь[8]. На протяжении её карьеры в области информатики, она пыталась привлечь женщин для работы в данной области[3] (её лозунг — «вычисления слишком важны, чтобы оставлять их мужчинам»), а также была хорошим наставником для студентов[9].
Последние годы жизни
Карен Спарк Джонс умерла от рака 4-го апреля 2007 года в городе Уиллингеме графства Кембриджшир. Была организована и проведена встреча в компьютерной лаборатории Кембриджского университета, чтобы воздать дань памяти и уважения. [10]
Личная жизнь
Карен Спарк Джонс была замужем за своим товарищем, учёным Кембриджского университета Роджером Нидхемом. Они построили свой дом в деревне Котон[англ.] (около 3 км к западу от Кембриджа в графстве Кембриджшир, Англия). По утрам они работали дома, возвращаясь на своё рабочее место лишь после полудня. Они жили долго и счастливо в скромном деревянном доме на протяжении многих лет, пока шум от шоссе М11[англ.] не заставил их покинуть это место.[11]
Почести
- Член британской академии, в которой она была вице-президентом в феврале 2000 года;
- Член AAAI;
- Член ECCAI;
- Стала президентом Association for Computational Linguistics в 1994 году.
Награды
- Премия Жерара Солтона[англ.] (1988)
- Американское общество по информатике и технологиям[англ.] Award of Merit (2002)
- ACL Lifetime Achievement Award (2004)
- Британское компьютерное общество[англ.] Медаль Лавлейс[англ.] (2007)
- ACM-AAAI Allen Newell Award (2007)
Примечания
- ↑ Karen Ida Boalth Spärck, 2007, p. 1.
- ↑ Journal of ACIST, 2008, p. 1.
- ↑ 3,0 3,1 Karen Ida Boalth Spärck, 2007, p. 2.
- ↑ 4,0 4,1 Karen Spärck Jones biography by Yorick Wilks, p. 3.
- ↑ The Analogy between Mechanical Translation and Library Retrieval, 1958.
- ↑ Information Storage and Retrieval, 1981.
- ↑ Statistical interpretation of term specificity, 2004.
- ↑ Karen Spärck Jones lecture.
- ↑ A Woman's Work.
- ↑ A Tribute to Karen Spärck Jones.
- ↑ Karen Spärck Jones biography.
Ссылки
- Karen Spärck Jones. Synonymy and Semantic Classification (thesis published as a book) (англ.). — Edinburgh University Press, 1986. — Vol. 1. — (Edinburgh Information Technology series).
- Tait, John[англ.]. Obituary (англ.). — Massachusetts Institute of Technology, 2007.
- Karen Spärck Jones, FBA, Professor Emerita of Computers and Information, Honorary Fellow of Wolfson College (англ.). Computer Laboratory, University of Cambridge (1 января 2010). — Professor Karen Spärck Jones was one of the pioneers in information retrieval (IR) and natural language processing (NLP).. Дата обращения: 12 ноября 2013.
- Karen Spärck Jones. A statistical interpretation of term specificity and its application in retrieval // Journal of Documentation : Journal. — MCB University: MCB University Press ISSN 0022-0418, 2004. — Т. 60, № 5. — С. 493—502.
- Sparck Jones, Karen[англ.]. Information Retrieval Experiment (англ.). — Butterworth & Co, 1981. Архивная копия от 13 ноября 2013 на Wayback Machine
- Robertson, Stephen; Tait, John. Journal of the American Society for Information Science and Technology (англ.). — 59. — Wiley Online Library, 2008. — P. 852—854.
- Karen Spärck Jones lecture (англ.). British Computer Society (23 мая 2013). — In Memoriam Karen Spärck Jones. Дата обращения: 12 ноября 2013.
- Karen Spärck Jones biography (англ.). The telegraph (24 апреля 2007). — Biography of the Karen Spärck Jones. Дата обращения: 12 ноября 2013.
- Karen Spärck Jones contributed significantly to two separate fields (англ.). The University of Sheffield (24 апреля 2007). — Biography of the Karen Spärck Jones which wrote by Yorick Wilks. Дата обращения: 8 декабря 2013.
- Masterman, Margaret; Needham, Roger; Sparck Jones, Karen. The Analogy between Mechanical Translation and Library Retrieval (англ.). — Proceedings of the International Conference on Scientific Information. — National academy of sciences, 1958. — P. 917—936.
- A Tribute to Karen Spärck Jones (англ.). Computer Laboratory, University of Cambridge (4 апреля 2007). — Meeting as a tribute to Professor Karen Spärck Jones. Дата обращения: 8 декабря 2013.
- Computer Science, A Woman's Work (англ.). IEEE Spectrum (1 мая 2007). — Biography of the Karen Spärck Jones. Дата обращения: 19 декабря 2013.
Дополнительная литература
- Computer Science, A Woman’s Work, IEEE Spectrum, May 2007
Ссылки
- Video: Natural Language and the Information Layer, Karen Spärck Jones, March 2007
- Obituary Архивная копия от 10 июля 2005 на Wayback Machine, The Daily Telegraph, 12 April 2007
- Obituary, The Times, 22 June 2007
- Родившиеся 26 августа
- Родившиеся в 1935 году
- Персоналии по алфавиту
- Родившиеся в Хаддерсфилде
- Умершие 4 апреля
- Умершие в 2007 году
- Умершие в Кембриджшире
- Учёные по алфавиту
- Учёные в области информатики Великобритании
- Выпускники Кембриджского университета
- Выпускники Гёртон-колледжа (Кембридж)
- Члены Британской академии
- Награждённые медалью Лавлейс