Большая часть генетической информации, содержащейся в ДНК, кодирует последовательность аминокислот. Процесс экспрессии генетической информации включает транскрипцию «текста», записанного на «языке нуклеиновой кислоты», в текст, записанный на «языке белков». Таково происхождение термина трансляция (дословно — перевод), используемого для обозначения процесса биосинтеза белков. Правила, которым следует трансляция, называют генетическим кодом.
Поскольку в биосинтезе участвуют 20 аминокислот, называемых протеиногенными, «язык» нуклеиновых кислот должен содержать по крайней мере 20 слов (кодонов) Однако в аминокислотном «алфавите» имеется только четыре «буквы» (А, Г, Ц и У или Т [или в англ. транскрипции: A, G, С и U или Т*]), так что для получения 20 различных слов каждое должно состоять по крайней мере из трех букв. Кодоны действительно включают три азотистых основания (триплет нуклеотидов). На схеме 1 представлен стандартный код ДНК (последовательность триплетов в некодирующей цепи), изображенный в виде круга. Схема читается от центра наружу, так что, например, триплет CAT кодирует аминокислоту гистидин. ДНК-кодоны идентичны таковым в мРНК (mRNA), за исключением того, что в мРНК вместо тимина (Т), характерного для ДНК, стоит урациял (U).
В качестве примера прочтения кода на схеме 2 показаны короткие участки нормального и мутантного гена β-глобина вместе с соответствующими последовательностями мРНК и аминокислот. Здесь показаны относительно часто встречающиеся точковые мутации, в результате которых остаток глутаминовой кислоты в положении 6 β-цепи заменен на валин. Такой мутантный гемоглобин в дезоксиформе склонен к агрегации, что вызывает деформацию эритроцитов и уменьшает эффективность транспорта кислорода (серповидноклеточная анемия).
В триплетном генетическом коде для 20 аминокислот потенциально существует 43 = 64 кодона. Таким образом, большинство аминокислот записывается несколькими кодонами, т. е. генетический код является вырожденным. Кроме того, имеются три триплета, которые обозначают конец транскрипции (стоп-кодоны). Еще один специальный кодон, стартовый (инициирующий) кодон, маркирует начало трансляции. Генетический код, показанный на рисунке, является почти универсальным. Этому стандарту не полностью соответствуют только митохондрии и некоторые микроорганизмы.