вторник, 10 сентября 2013 г.

Алфавит и лексемы языка C++

В тексте на любом естественном языке можно выделить четыре основных элемента: символы, слова, словосочетания и предложения. Подобные элементы содержит и алгоритмический язык, только слова называют лексемами (элементарными конструкциями), словосочетания — выражениями, а предложения — операторами. Лексемы образуются из символов, выражения — из лексем и символов, а операторы — из символов, выражений и лексем. В этой записи рассмотрен алфавит языка программирования C++ и его лексемы.

Алфавит

  • прописные и строчные латинские буквы: А, В, С, Z, а, b, с, z 
  • цифры: 0, 1,2, 3,4, 5, 6,7,8,9 
  • специальные символы: + -/ % . ? ! " > | \ ' _ & ~
  • знаки пунктуации языка: [] () {} , ; : ... * = # 
  • пробельные символы: пробел, символ табуляции, символ перевода строки 
  • прочие символы — только в комментариях к тексту программы
Алфавит C++ служит для построения слов, которые в C++ называются лексемами.

Лексемы — единицы текста программы, которые при компиляции воспринимаются как единое целое и по смыслу не могут быть разделены на более мелкие элементы

Различают пять типов лексем:
  • идентификаторы, 
  • ключевые слова, 
  • знаки (символы) операций, 
  • литералы, 
  • разделители.