Полный индекс "Введения в информационный поиск" | Participants
|
- Statistics
- Participants
- Translate into Russian
- Translation result
- Translated in draft, editing and proof-reading required. Completed: 85%.
If you do not want to register an account, you can sign in with OpenID.
IIR Index full | ||
{chi}^2 feature selection | ||
{delta} codes | ||
{gamma} encoding | — Гамма-кодирование? — AndreyBelov | |
{k} nearest neighbor classification | ||
{k}-gram index | ||
{L}_2 distance | — {L}_2-расстояние. — AndreyBelov Лучше "евклидово": http://www.gramota.ru/slovari/dic/?wo... — AndreyBelov — Евклид однозначно победил Эвклида — iseg | |
1/0 loss | ||
11-point interpolated average precision | — Метод оценки точности и полноты, применявшийся на первых 8 конференциях TREC. — Maxime | |
20 Newsgroups | — Название коллекции документов (http://people.csail.mit.edu/jrennie/2...). Наверное, и не нужно переводить. — AndreyBelov | |
A/B test | — метод тестирования многопараметрических систем. — Maxime | |
accent | — В принципе, знак ударения - тоже диакритический. — AndreyBelov — просто "диакритика" — iseg | |
access control lists | ||
accumulator | ||
accuracy | — РОМИП — pbraslavski iseg: доля верных ответов, доля правильных ответов iseg@ имеется в виду "правильность", "корректность", "верность": "не-ошибка" ни первого, ни второго рода. соответственно fallout предлагаю назвать "доля неверных ответов" — pbraslavski More 5 comments — решили - "правильность" - ок? — iseg | |
active learning | ||
ad hoc retrieval | — iseg@, речь о "поиске из головы", "спонтанном поиске", то есть НЕ выбор слов или понятий из словаря или классификатора, а поиск при помощи строки для ввода произвольного запроса — pbraslavski — Может тогда оставить просто "поиск по запросу" пользователя? — itman | |
add-one smoothing | — Кавычки не нужны, наверное. — AndreyBelov Мне без "с" больше нравилось. — AndreyBelov | |
adjacency table | ||
adversarial information retrieval | ||
Akaike Information Criterion | ||
algorithmic search | — в противоположность sponsored search — pbraslavski — предлагаю проще: "алгоритмический поиск" - это вполне устойчиво в seo-мире — iseg | |
anchor text | ||
any-of classification | ||
assessor | ||
authority score | — iseg — pbraslavski | |
auxiliary index | вспомогательный индекс (индекс для новых документов) | |
average-link clustering | — Среднесвязная кластеризация? По аналогии с односвязной и полносвязной. — AndreyBelov | |
B-tree | ||
bag of words model | ||
bag of words | ||
bag-of-words | — Обычно переводят просто как "набор слов". Но "мешок слов" лучше :) — AndreyBelov | |
bagging | — сайт BaseGroup.ru: dmitry_klyushin@ — pbraslavski я не нашел в книге — pbraslavski | |
balanced F-measure | ||
Bayes error rate | — Источник: http://lib.mexmat.ru/books/8918/s3 — AndreyBelov А почему с прописной буквы? Все "байесовские", "байесовы" и "булевы" надо со строчной. Ср. в словаре Лопатина: "булев, -а, -о (от Буль): булева алгебра, булева операция, булево выражение, булево значение". http://gramota.ru/slovari/dic/?lop=x&... — AndreyBelov | |
Bayes Optimal Decision Rule | ||
Bayes risk | ||
Bayes' Rule | — опять по принципу "не придумывал", хотя Маннинг, судя по апострофу после слова Bayes, думает, что придумывал — iseg | |
Bayesian network model | ||
Bayesian networks | — суффикс -ian, -ean переводим краткой формой (традиция)? — pbraslavski — Ок, давайте краткой. — AndreyBelov | |
Bayesian prior | ||
Bernoulli model | ||
best-merge persistence | — "Best-merge" неоднократно встречается в сочетании с разными терминами. Возможно, его следует переводить как "лучший Х для слияния", где Х-ом может быть кластер, кандидат и проч. ("best-merge cluster", "best-merge candidate"). Но не уверен. — AndreyBelov | |
bias-variance tradeoff | компромисс между смещением и разбросом, компромисс между смещением и дисперсией | — можно и проще: "компромисс смещения и дисперсии" — iseg — это не дисперсия, см. 14.6, с. 286-288 — pbraslavski More 3 comments — Дисперсия - это конкретно определяемая величина - средний кварат отклонения и ничто другое; под разбросом можно понимать и другие меры вариабельности данных; в частности Webb и Domingos определяют variance для задач классификации как другую величину, имеющую схожую интерпретацию. Для задач регрессии (откуда это всё и пошло) variance - это действительно в точности дисперсия. — vokov |
bias | — предрасположенность? — pbraslavski — Если по отношению к выборке, то нерепрезентативная выборка — itman — "смещение" — iseg | |
biclustering | — то же, что co-clustering (одновременная кластеризация слов и документов) — pbraslavski — Борис Григорьевич Миркин знает тонкую разницу между би- (это его термин) и ко- (которое вроде бы появилось позже). Но перевод правильный ;) — vokov | |
bigram language model | ||
bigram | — муж род "биграмм" встречается прмерно в 10 раз чаще (поиском проверял) — iseg — Что-то посмотрел я первые 50 результатов в "Яндексе", там везде женский род - "биграмма". — AndreyBelov | |
binary independence model | — А "binary independence variables" как бинарные "переменные независимости"? Вообще здесь Binary - в смысле булевская. Может быть так и сделать "булевская независимая модель"? или "бинарная независимая модель"? — iseg — Я так понимаю, что переменные - "binary independent", а тут "binary independence". Т. е. "независимость" должна фигурировать в термине, по-моему. — AndreyBelov | |
Binary Independence Model | ||
binary term incidence vector | ||
binary tree | ||
biword index | ||
biword | ||
blind relevance feedback | ||
blocked sort-based indexing algorithm | ||
blocked sort-based indexing | ||
blocked storage | — Блочное хранение? — AndreyBelov | |
blog | ||
BM25 weights | ||
body of texts | ||
Boolean queries | — Все "байесовы" и "булевы" нужно со строчной буквы, а не с прописной. Я уже тут где-то приводил ссылку на словарь Лопатина. — AndreyBelov | |
Boolean retrieval | — Возможно, лучше "булевский". — AndreyBelov — ветхозаветный суффикс -ean принято переводить как краткую (как бы архаичную) русскую форму: "булева алгебра", "гамильтонов цикл", "лапласово чего-то", и тд. Хотя "булевский" чаще встречается в жизни, но религия требует "булев"? — iseg — Да, пусть будет "булев", в словаре Лопатина так. — AndreyBelov | |
Boolean score function | — пусть уж здесь будет "релевантности" (термина нет в окончательном ПУ книги) — pbraslavski | |
boolean model | ||
boosted decision tree | — именно во множественном числе, т.к. бустинг одного базового классификатора смысла не имеет — vokov — что с усилением и форсированием - вместо бустинга - не катят? — iseg — де факто уже все говорят "бустинг", а усиление и форсирование навевают побочные ассоциации с чем-то военно-техническим — vokov | |
boosting | — сайт BaseGroup.ru dmitry_klyushin@ — pbraslavski | |
bottom-up clustering | ||
bowtie | ||
break-even point | — точность=полнота — pbraslavski | |
break-even | ||
BSBI | ||
Buckshot algorithm | ||
buffer | ||
caching | ||
capture-recapture method | метод повторного захвата (название популярного метода оценки размера популяции) | — http://download.yandex.ru/company/pap... — iseg — this is a general statistical estimation method, not just for search output: http://en.wikipedia.org/wiki/Mark_and... — yea — вариант метода, который применяется в зоологии для оценки размера полуляции: поймать животных, пометить, выпустить, поймать снова и по доле помеченных оценить размер популяции — pbraslavski — понял: это из биологии. но тогда доминирует перевод "повторный захват". Реже "повторный охват" и "двойной охват" — iseg |
cardinality, in clustering | — т.е. целевое количество кластеров — pbraslavski | |
CAS topics | Content And Structure topics; запросы к системе поиска структурированной информации, содержащие помимо ключевых слов ограничения по структуре (INEX) | |
case-folding | Comment was deleted — "Преобразование регистра"? "Схлопывание", "свертывание", "складывание" и проч. как бы намекают, что имеется в виду перевод в нижний регистр, хотя на самом деле это может быть любое преобразование. — AndreyBelov — предлагаю: игнорирование регистра (case folding) против "использование истинного регистра" (truecasing) — iseg | |
cashing | опечатка, в оригинале этого термина нет ни в индексе, ни в тексте | |
category | ||
centroid, in relevance feedback | ||
centroid-based classification | ||
centroid | ||
chain rule | ||
chaining, in clustering | образование цепочек при кластеризации (эффект метода одиночной связи) | |
champion list | — Список наиболее релевантных документов для конкретного словарного терма. — Maxime Предварительно составленный список. — Maxime top docs = champion lists = fancy lists — Maxime — Список лидеров? — AndreyBelov | |
citation index | ||
class boundary | ||
classification function | — функция классификации? — pbraslavski | |
classification | ||
classifier | ||
CLEF | — имхо можно не переводить — pbraslavski — "Коллекция CLEF (Cross Language Evaluation Forum)"? — AndreyBelov | |
click spam | скликивание (злонамеренные клики по рекламным объявлениям) | |
clickstream mining | — Просто "анализ кликов"? — AndreyBelov | |
clickthrough log analysis | — Вроде бы, это то же самое, что и clickstream mining? — AndreyBelov — как-то сложно получилось, предложил упростить — iseg — Наверное, оно ведь может относиться не только к кликам из поисковой выдачи (а, например, еще к кликам по рекламе на сайте)? Оставить просто "анализ кликов"? — AndreyBelov | |
clickthrough mining | — Возможно имеется в виду clickstream mining, синоним для clickthrough log analysis — Maxime | |
clique | — iseg@ тесно связанный подграф. также claque=клака – "группа поддержки" в графе — pbraslavski | |
cloaking | — надо будет пояснить в глоссарии: подмена содержимого страницы для робота поисковой системы — iseg | |
cluster hypothesis | ||
cluster pruning | — iseg: отбрасывание кластеров — pbraslavski | |
cluster, in relevance feedback | — Зависит от перевода "relevance feedback". — AndreyBelov | |
cluster-based classification | ||
cluster-internal labeling | — Противопоставляется "differential cluster labeling". — AndreyBelov — т.е. смотрим на распределение слов внутри кластера, не сравниваем с другими — pbraslavski | |
cluster | ||
CO topics | Content Only topics; запросы к системе поиска структурированной информации, содержащие только ключевые слова аналогично поиску неструктурированной информации (INEX) | |
co-clustering | — Одновременная кластеризация документов и слов (то же, что biclustering) — pbraslavski | |
collection frequency | ||
collection | ||
combination similarity | — Ср. перевод "cosine similarity". А просто "similarity", соответственно, нужно будет переводить как "меру близости". — AndreyBelov — Есть вариант: многие предпочитают говорить "сходство", т.к. "близость" навевает ассоциации... — vokov | |
complete search system | ||
complete-link clustering | — "Полносвязная кластеризация"? — AndreyBelov Термин "полносвязная кластеризация" встречается здесь: http://lib.mexmat.ru/books/28404/s3 — AndreyBelov | |
complete-linkage clustering | ||
component coverage | ||
compound-splitter | — разбиение составных слов? — pbraslavski | |
compounds | — В контексте compound (word) — itman | |
computation of score | вычисление рейтинга, вычисление оценки релевантности | — Может лучше вычисление оценки релевантности? — itman |
concept drift | — что-от как-то мощно получилось. предлагаю попроще: "уход от темы" или "уход от основного смысла" — iseg — Так он и в английском варианте довольно мощно выглядит. "Уход от темы" - нетерминологично, на мой взгляд. Можно "понятийный дрейф", но это тоже мощно. — AndreyBelov — это ситуация, когда тема/концепция со временим выражается другими словами — pbraslavski — Так почему тогда это "дрейф тем"? Тема-то обычно остается одна и та же, а вот ее понятийное наполнение меняется. Допустим, у нас есть рубрика "Популярные фильмы". Сегодня это "Ледниковый период 3" и "Трансформеры 2", а завтра "Ледниковый период 4" и "Трансформеры 3". Т. е. происходит как раз "дрейф понятий". И concept здесь - это, по-моему, все-таки "понятие" или "понятийный", а не "концепция". — AndreyBelov | |
conditional independence, assumption | ||
confusion matrix | ||
connected component | ||
connectivity queries | — это про сервер обслуживающий запросы вида "ссылается ли страница 1 на страницу 2" — iseg | |
connectivity server |

— Дельта-коды? — AndreyBelov