В тексте на любом естественном языке можно выделить четыре основных элемента: символы, слова, словосочетания и предложения. Подобные элементы содержит и алгоритмический язык, только слова называют лексемами (элементарными конструкциями), словосочетания — выражениями, а предложения — операторами. Лексемы образуются из символов, выражения — из лексем и символов, а операторы — из символов, выражений и лексем. В этой записи рассмотрен алфавит языка программирования C++ и его лексемы.
Алфавит
- прописные и строчные латинские буквы: А, В, С, Z, а, b, с, z
- цифры: 0, 1,2, 3,4, 5, 6,7,8,9
- специальные символы: + -/ % . ? ! " > | \ ' _ & ~
- знаки пунктуации языка: [] () {} , ; : ... * = #
- пробельные символы: пробел, символ табуляции, символ перевода строки
- прочие символы — только в комментариях к тексту программы
Лексемы — единицы текста программы, которые при компиляции воспринимаются как единое целое и по смыслу не могут быть разделены на более мелкие элементы
Различают пять типов лексем:
- идентификаторы,
- ключевые слова,
- знаки (символы) операций,
- литералы,
- разделители.