January 24th, 2014

общежитие, Корваллис

научная школа, умещающаяся под шляпкой мухомора-1

Некоторое время назад я очень взволнованным голосом писал о прикладной науке (более-менее вокруг предсказания поведения сложнхых систем). Теперь эти записи ушли в архив, потому что, как справедливо заметил один из моих читателей, невосторженный образ мыслей плохо влияет на рабочие интервью. Но серию записок о науке я бы хотел продолжить.

Например, я обещал рассказать о такой экзотике, как статистическое предсказание судебных решений. Но сначала нужно сделать предисловие, иначе мы все совсем запутаемся, а старшие коллеги помрут от смеха. Особенно те, кто занят статистическим предсказанием в областях хорошо изученных и традиционных (финансовый рынок, социальные сети, размещение и поиск информации в базах данных).

* Во-первых, я стараюсь рассказывать об очень простой математике. Она простая в том смысле, что использует, где возможно, уже существующий набор инструментов. Мы пытаемся из существующего положения дел сразу же перейти к практическому выводу. Промежуточные этапы работы могут быть интересны профессиональным математикам, а могут и нет. Скорее нет, чем да. Нам бы хотелось, чтобы да -- нам ведь нужны не столько выводы, сколько строгий, правильный, воспроизводимый контроль над цепочкой от данных к выводам, а там может быть все очень интеллектуально трудно и даже безнадежно, а у нас всё равно получилось.

* Во-вторых, у читателя может возникнуть впечатление, что любое научное предсказание - это обобщение, экстраполяция. Проведение некоей линии по известным точкам, и дальше за их предел, с учетом неких законов, свойств, которые мы заметили раньше и ожидаем теперь всюду и всегда. Это не совсем так.
Например, стастистика даёт нам возможность осмысленно говорить о вероятности или неопределенности каких-то событий, обобщать наблюдения в виде правил, и дальше применять эти правила для оценки ожидаемого исхода ситуации, с которой мы ещё не сталкивались лично. Мы бросаем кубики, замечаем какие выпадают суммы, придумываем для этого набора чисел слово "распределение", пользуемся свойствами этого распределения для предсказания бросков любых других кубиков и вообще всего похожего на кубики. Первая глава простого учебника по теории вероятности. Но вот это вот всё - не суть статистики как научной дисциплины. Это то, что она делает в свободное время, для развлечения и разминки.
Главная задача статистики - исследование свойств, которые не принадлежат никакому набору данных, а, выше того, остаются в силе, какие бы данные нам не достались. (По правилам русской грмтк следовало бы сказать "а, напротив того", но это не напротив).
Поэтому в учебнике будут математические теоремы, доказательства свойств некоей группы вот именно специально так построенных функций. Много интегралов. Ни одного игрального кубика.

На самом деле математика, наука вообще, заняты глубочайшим и подлым обманом природы. Природа "думает", что мы её наблюдаем с помощью органов чувств, и делаем выводы по аналогии, как ребёнок, который удивляется если черная бумажка оказалась с другой стороны белой. На самом деле мы её уже давно наблюдаем изнутри платонической головы, путем построения моделей, и находим свойства, правила, которые остаются в силе для всего и всегда.

Ну, то есть, ясное дело, если возникли какие-то новые мысли или наблюдения, модель нужно подправить, она не алмазная. Элемента самообмана в этом мало - платонический мир гораздо суровее реального, он не терпит любителей двусмысленных интерпретаций. Экспериментальная наука помогает, замечательно помогает отрезать ложные ветки, а ещё лучше отложить их на потом (а вдруг это просто ветка не от того дерева, так уже много раз бывало).

* В-третьих, нужно привыкнуть к разногласиям по поводу формата ответа. Я вообще не уверен, что наука вообще должна что-то предсказывать, даже в таком смысле как "если ты и дальше будешь пилить эту ветку, ты упадёшь". Читателя должен интересовать не столько ответ, сколько процесс решения любой задачи - какие там начальные предположения, к какому набору ситуаций они подходят, какие факторы влияют на решение, что можно изменить. Мягкий контакт науки и реальности.

Но. Политикам и инженерам нужно принимать решения. В конечном итоге ответом должна быть цифра, или "да-нет". Просто эта цифра не всегда означает то, что она означает в учебнике арифметики :)