Вывод типов
Вывод типов (англ. type inference) — в программировании возможность компилятора самому логически вывести тип значения у выражения. Впервые механизм вывода типов был представлен в языке ML, где компилятор всегда выводит наиболее общий полиморфный тип для всякого выражения. Это не только сокращает размер исходного кода и повышает его лаконичность, но и нередко повышает повторное использование кода[1].
Вывод типов характерен для функциональных языков программирования, хотя со временем он был частично реализован и в объектно-ориентированных языках (C#, D, Visual Basic .NET, Nim, C++11, Vala, Java[a]), где ограничивается возможностью опустить тип идентификатора в определении с инициализацией (см. синтаксический сахар). Например:
var s = "Hello, world!"; // Тип переменной s (от string) выведен исходя из инициализатора
Алгоритмы
Алгоритм Хиндли — Милнера
Алгоритм Хи́ндли — Ми́лнера — механизм вывода типов выражений, реализуемый в языках программирования, основанных на системе типов Хиндли — Милнера, таких как ML (первый язык этого семейства), Standard ML, OCaml, Haskell, F#, Fortress и Boo. Язык Nemerle использует этот алгоритм с рядом необходимых изменений[2].
Механизм вывода типов основан на возможности автоматически полностью или частично выводить тип выражения, полученного при помощи вычисления некоторого выражения. Так как этот процесс систематически производится во время трансляции программы, транслятор часто может вывести тип переменной или функции без явного указания типов этих объектов. Во многих случаях можно опускать явные декларации типов — это можно делать для достаточно простых объектов, либо для языков с простым синтаксисом. Например, в языке Haskell реализован достаточно мощный механизм вывода типов, поэтому указание типов функций в этом языке программирования не требуется. Программист может указать тип функции явно для того, чтобы ограничить её использование только для конкретных типов данных, либо для более структурированного оформления исходного кода.
Для того, чтобы получить информацию для корректного вывода типа выражения в условиях отсутствия явной декларации типа этого выражения, транслятор либо собирает такую информацию из явных деклараций типов подвыражений (переменных, функций), входящих в изучаемое выражение, либо использует неявную информацию о типах атомарных значений. Такой алгоритм не всегда помогает определить тип выражения, особенно в случаях использования функций высших порядков и параметрического полиморфизма достаточно сложной природы. Поэтому в сложных случаях, когда есть необходимость избежать неоднозначностей, рекомендуется явно указывать тип выражений.
Сама модель типизации основана на алгоритме вывода типов выражений, который имеет своим источником механизм получения типов выражений, используемый в типизированном λ-исчислении, который был предложен в 1958 г. Х. Карри и Р. Фейсом. Далее уже́ Роджер Хиндли в 1969 г. расширил сам алгоритм и доказал, что он выводит наиболее общий тип выражения. В 1978 г. Робин Милнер независимо от Р. Хиндли доказал свойства эквивалентного алгоритма. И, наконец, в 1985 г. Луис Дамас окончательно показал, что алгоритм Милнера является законченным и может использоваться для полиморфных типов. В связи с этим алгоритм Хиндли — Милнера иногда называют также и алгоритмом Дамаса — Милнера.
Система типов определяется в модели Хиндли — Милнера следующим образом:
- Примитивные типы [math]\displaystyle{ v }[/math] являются типами выражений.
- Параметрические переменные типов α являются типами выражений.
- Если [math]\displaystyle{ \sigma_{1} }[/math] и [math]\displaystyle{ \sigma_{2} }[/math] — типы выражений, то тип [math]\displaystyle{ \sigma_{1} \rightarrow \sigma_{2} }[/math] является типом выражений.
- Символ [math]\displaystyle{ \bot }[/math] является типом выражений.
Выражения, типы которых вычисляются, определяются довольно стандартным образом:
- Константы являются выражениями.
- Переменные являются выражениями.
- Если [math]\displaystyle{ e_{1} }[/math] и [math]\displaystyle{ e_{2} }[/math] — выражения, то ([math]\displaystyle{ e_{1} e_{2} }[/math]) — выражение.
- Если [math]\displaystyle{ v }[/math] — переменная, а [math]\displaystyle{ e }[/math] — выражение, то [math]\displaystyle{ \lambda v.e }[/math] — выражение.
Говорят, что тип [math]\displaystyle{ \sigma_{1} }[/math] является экземпляром типа [math]\displaystyle{ \sigma_{2} }[/math], когда имеется некое преобразование [math]\displaystyle{ \rho }[/math] такое, что:
[math]\displaystyle{ \sigma_{1} = \rho(\sigma_{2}) }[/math]
При этом обычно полагается, что на преобразования типов [math]\displaystyle{ \rho }[/math] накладываются ограничения, заключающиеся в том, что:
- [math]\displaystyle{ \rho(\sigma_{1} \rightarrow \sigma_{2}) = \rho(\sigma_{1}) \rightarrow \rho(\sigma_{2}) }[/math]
- [math]\displaystyle{ \rho(v) = v }[/math]
Сам алгоритм вывода типов состоит из двух шагов — генерация системы уравнений и последующее решение этих уравнений.
Построение системы уравнений
Построение системы уравнений основано на следующих правилах:
- [math]\displaystyle{ \Gamma v = \tau }[/math] — в том случае, если связывание [math]\displaystyle{ v : \tau }[/math] находится в [math]\displaystyle{ \Gamma }[/math].
- [math]\displaystyle{ \Gamma (g e) = \tau }[/math] — в том случае, если [math]\displaystyle{ \tau_{1} = \tau_{2} \rightarrow \tau }[/math], где [math]\displaystyle{ \tau_{1} = \Gamma g }[/math] и [math]\displaystyle{ \tau_{2} = \Gamma e }[/math].
- [math]\displaystyle{ \Gamma (\lambda v.e) = \tau \rightarrow \tau_{e} }[/math] — в том случае, если [math]\displaystyle{ \tau_{e} = \Gamma' e }[/math], где [math]\displaystyle{ \Gamma' }[/math] это [math]\displaystyle{ \Gamma }[/math] с добавленным связыванием [math]\displaystyle{ v : \tau }[/math].
В этих правилах под символом [math]\displaystyle{ \Gamma }[/math] понимается набор связываний переменных с их типами:
[math]\displaystyle{ \Gamma = v_{1} : A_{1}, v_{2} : A_{2}, \ldots, v_{n} : A_{n} }[/math]
Решение системы уравнений
Решение построенной системы уравнений основано на алгоритме унификации. Это достаточно простой алгоритм. Имеется некоторая функция [math]\displaystyle{ u }[/math], которая принимает на вход уравнение типов и возвращает подстановку, которая делает левую и правую части уравнения одинаковыми («унифицирует» их). Подстановка — это просто проекция переменных типов на сами типы. Такие подстановки могут вычисляться различными способами, которые зависят от конкретной реализации алгоритма Хиндли — Милнера.
См. также
Примечания
Комментарии
- ↑ поддержка добавлена в Java SE 10
Источники
- ↑ Andrew W. Appel. A Critique of Standard ML. — Princeton University, revised version of CS-TR-364-92, 1992.
- ↑ Michał Moskal. Type Inference with Deferral. — 2005. Архивировано 4 марта 2016 года.
Ссылки
- Реализация алгоритма Хиндли-Милнера на Perl (англ.)
- Archived e-mail message by Roger Hindley, explains history of type inference
- Polymorphic Type Inference by Michael Schwartzbach, gives an overview of Polymorphic type inference.
- Principal type-schemes for functional programs. A re-typeset copy of the Damas and Milner paper which described the soundness and completeness proofs.
- Tutorial and complete implementation in Standard ML The tutorial includes some of the logical history of type systems as well as a detailed description of the algorithm as implemented. Some typographic errors in the original Damas Milner paper are corrected.
- Basic Typechecking paper by Luca Cardelli, describes algorithm, includes implementation in Modula-2
- Implementation of Hindley-Milner type inference in Scala, by Andrew Forrest (retrieved July 30, 2009)
- Implementation of Hindley-Milner in Perl 5, by Nikita Borisov (недоступная ссылка). Дата обращения: 12 марта 2009. Архивировано 18 февраля 2007 года.
- What is Hindley-Milner? (and why is it cool?) Explains Hindley-Milner, examples in Scala
- http://fprog.ru/2010/issue5/roman-dushkin-hindley-milner/ Модель типизации Хиндли-Милнера и пример её реализации на языке Haskell
Для улучшения этой статьи желательно: |