Бертран Рассел Математическая логика, основанная на теории типов
Нижеследующая теория символической логики зарекомендовала себя прежде всего своей способностью решать определённые противоречия, из которых математикам лучше всего известен парадокс Бурали-Форти, касающийся наибольшего ординала
. Но рассматриваемая теория не зависит всецело от этой косвенной рекомендации; она, если я не ошибаюсь, к тому же определённо созвучна здравому смыслу, который в своей основе делает её правдоподобной. Однако это не та заслуга, на которой следовало бы слишком настаивать, ибо здравый смысл в гораздо большей степени подвержен ошибкам, чем обычно считается. Таким образом, я начну с формулировки некоторых противоречий, которые должны быть разрешены, а затем покажу, каким образом теория логических типов формирует своё решение.
I. ПАРАДОКСЫ
(1) Старейшим противоречием рассматриваемого вида, является парадокс Эпимени-да. Критянин Эпименид сказал, что все критяне лжецы, и все высказывания, сделанные критянами, определённо ложны. Ложно ли высказывание самого Эпименида? Простейшую форму этого противоречия предоставляет человек, который говорит ‘Я сейчас лгу’; если он лжёт, он говорит правду, и наоборот.
(2) Пусть w - это класс всех тех классов, которые не являются элементами самих себя. Тогда, каким бы ни был класс х, 'х есть w’ эквивалентно
х не есть o’
. Поэтому, если х придать значение w, то ‘w есть w’ эквивалентно ‘w не есть w’.
(3) Пусть Т - отношение, которое имеет место между двумя отношениями R и S всегда, когда R не имеет отношение R к S. Тогда, какими бы ни были отношения R и S, 'R имеет отношение L к S’ эквивалентно ‘R не имеет отношение R к S’. Следовательно, если придать значение Т как R, так и S, то ‘Т имеет отношение Т к Т эквивалентно ‘Т не имеет отношение Т к Т.
(4) Число слов в русских названиях конечных целых чисел возрастает по мере возрастания чисел и должно постепенно увеличиваться неограниченно, поскольку при заданном конечном числе слов может быть создано только конечное число имён. Поэтому, имена некоторых чисел должны состоять по меньшей мере из десяти слов, и среди них должно быть наименьшее. Следовательно, ‘наименьшее целое число, не именуемое менее чем десятью словами’ должно обозначать определённое число. Но ‘наименьшее целое число, не именуемое менее чем десятью словами’ само является именем, состоящим из девяти слов; стало быть, наименьшее целое число, не именуемое менее, чем десятью словами, может быть наименовано девятью словами, что является противоречием
.
(5) Среди трансфинитных ординалов некоторые могут быть определены, а некоторые - нет; ибо совокупное число возможных определений есть N
0, тогда как число трансфинитных ординалов превышает No. Следовательно, должны быть неопределимые ординалы, и среди них должен быть наименьший. Но он и определяется как ‘наименьший неопределимый ординал’, что является противоречием
.
(6) Парадокс Ришара родственен парадоксу о наименьшем неопределимом ординале
. Он состоит в следующем: Рассмотрим все десятичные дроби, которые могут быть определены посредством конечного числа слов; пусть Е будет классом таких дробей. Тогда Е имеет N
0 элементов; следовательно, его члены могут быть упорядочены как 1-ый, 2-ой, 3ий ... Пусть N будет числом, определяемым следующим образом: Если n-ая цифра в n-ой дроби есть р, то пусть n-ая цифра в N будет р + 1 (или 0, если р = 9). Тогда N отлична от всех членов Е, поскольку, каким бы не было конечное значение п, n-ая цифра в N отлична от n-ой цифры в n-ных дробях, составляющих Е, и, следовательно, N отлична от n-ой дроби. Тем не менее, мы определили N с помощью конечного числа слов и, следовательно, N должна быть членом Е. Таким образом, N и является, и не является членом Е.
(7) Парадокс Бурали-Форти формулируется следующим образом
: Можно показать, что каждая вполне упорядоченная последовательность имеет ординальное число, что последовательность ординалов, возрастающая и включающая любой данный ординал, превышает данный ординал на один, и (на весьма надёжных и естественных предпосылках) что последовательность всех ординалов (в порядке увеличения) является вполне упорядоченной. Отсюда следует, что последовательность всех ординалов имеет ординальное число, скажем, W. Но в этом случае последовательность всех ординалов, включающих W, имеет ординальное число W + 1, которое должно быть больше, чем W. Следовательно, W не является ординальным числом всех ординалов.
У всех указанных выше противоречий (которые суть лишь выборка из бесконечного числа) есть общая характеристика, которую мы можем описать как самореферентность или рефлексивность. Замечание Эпименида должно включать само себя в свою собственную сферу. Если все классы, при условии, что они не являются элементами самих себя, являются элементами w, то это должно применяться также и к w; то же самое относится к аналогичному противоречию с отношениями. В случае имён и определений парадоксы вытекают из рассмотрения неименуемости и неопределимости как элементов имён и определений. В случае парадокса Бурали-Форти последовательность, чьё ординальное число вызывает затруднение, является последовательностью всех ординальных чисел. В каждом противоречии нечто говорится о всех случая некоторого рода, и из того, что говорится, по-видимому, производится новый случай, который как относится, так и не относится к тому же самому роду, что и те случаи, все из которых рассматривались в том, что было сказано. Просмотрим противоречия одно за другим и увидим, как это происходит.
(1) Когда человек говорит ‘Я сейчас лгу’, мы можем интерпретировать его высказывание как: ‘Существует пропозиция, которую я утверждаю и которая является ложной’. Все высказывания, что ‘существует ’ то-то и то-то могут рассматриваться как отрицание того, что противоположное всегда истинно. Таким образом, ‘Я сейчас лгу’ становится: ‘Не для всех пропозиций верно, что или я их не утверждаю, или они являются истинными’; другими словами, ‘Не верно для всех пропозиций р, что если я утверждаю р, р - истинно’. Парадокс вытекает из рассмотрения этого высказывания как утверждающего пропозицию, которая, стало быть, должна входить в сферу высказывания. Это, однако, делает очевидным то, что понятие ‘все пропозиции’ является незаконным; ибо, в противном случае, должна быть пропозиция (типа указанной выше), которая говорит о всех пропозициях и, тем не менее, не может быть включена в совокупное целое пропозиций, о которых она говорит, без противоречия. Что бы мы не полагали в качестве совокупного целого пропозиций, высказывание об этой целостности порождает новую пропозицию, которая, под угрозой противоречия, должна лежать вне рассматриваемой целостности. Увеличивать совокупное целое бесполезно, ибо это равным образом увеличивает сферу высказываний об этой целостности. Следовательно, совокупного целого пропозиций быть не должно, а ‘все пропозиции ’ должно быть бессмысленной фразой.
(2) В этом случае класс w определяется указанием на ‘все классы’, а затем оказывается, что он является одним среди них. Если мы находим помощь, решив, что класс не является элементом самого себя, тогда w становится классом всех классов, и мы должны решить, что он не является элементом самого себя, т.е. не является классом. Это - единственная возможность, если не существует такой вещи как класс всех классов в смысле, требуемом этим парадоксом. То, что такого класса нет, вытекает из того, что если мы предположим его существование, эта предположение немедленно возрождает (как в указанном выше противоречии) новые классы, лежащие вне предполагаемого совокупного целого всех классов.
(3) Этот случай в точности аналогичен (2) и показывает, что мы не можем на законных основаниях говорить о ‘всех отношениях’.
(4) ‘Наименьшее целое число, не именуемое менее чем десятью словами’ включает совокупное целое имён, ибо оно представляет собой ‘наименьшее целое число такое, что все имена либо не применимы к нему, или состоят из более чем десяти слов’. Здесь при получении противоречия мы предполагаем, что фраза, содержащая ‘все имена’, сама является именем, хотя из противоречия видно, что она не может быть одним из имён, относительно которых предполагалось, что это все существующие имена. Следовательно, ‘все имена’ есть незаконное понятие.
(5) Этот случай сходным образом показывает, что незаконным понятием является и ‘все определения’.
(6) Это противоречие решается подобно (5), если заметить, что ‘все определения ’ -понятие незаконное. Поэтому, число Е не определимо конечным числом слов, будучи фактически не определимым вообще
.
(7) Противоречие Бурали-Форти показывает, что ‘все ординалы’ незаконное понятие; ибо, в противном случае, все ординалы в порядке увеличения образуют вполне упорядоченную последовательность, которая должна иметь ординальное число большее, чем все ординалы.
Таким образом, все наши противоречия в общем допускают совокупное целое, такое, что если бы оно было законным, то сразу увеличивалось бы за счёт новых элементов, определимых в терминах его самого.
Это приводит нас к правилу: ‘То, что включает всё из совокупности, не должно быть элементом совокупности ’; или, наоборот: ‘Если определённая совокупность, при условии, что она обладает целостностью, имела бы элементы, определимые только с точки зрения этой целостности, то эта совокупность не обладает целостностью ’
.
Указанный выше принцип в своей области является, однако, чисто отрицательным. Он подходит для того, чтобы показать, что многие теории являются ошибочными, но он не показывает, как нужно избавляться от ошибок. Мы не можем сказать: ‘Говоря о всех пропозициях, я подразумеваю все пропозиции, кроме тех, в которых упоминаются “все пропозиции”’; ибо в этом объяснении мы упомянули пропозиции, в которых упоминаются все пропозиции, чего нельзя сделать осмысленно. Невозможно избежать упоминания вещи, упоминая, что мы не хотели её упоминать. Говоря о человеке с длинным носом, можно сказать: ‘Когда я говорю о носах, я исключаю столь необычно длинные’, но это вряд ли было бы успешной попыткой избежать щекотливой темы. Таким образом, если мы не хотим погрешить против указанного выше негативного принципа, необходимо сконструировать нашу логику без упоминания таких вещей как ‘все пропозиции’ или ‘все свойства’ и даже без необходимости говорить, что мы такие вещи исключаем. Это исключение должно естественно и неизбежно вытекать из нашей позитивной доктрины, которая должна сделать ясным, что ‘все пропозиции’ и ‘все свойства’ являются бессмысленными фразами.
Первое встающее перед нами затруднение касается фундаментальных принципов логики, известных под затейливым названием ‘законы мышления ’. Например, ‘Все пропозиции являются либо истинными, либо ложными’ становится бессмысленным. Если бы это положение было значимым, оно было бы пропозицией и попадало бы в свою собственную сферу действия. Тем не менее, должна быть найдена некоторая замена, или всякое общее рассмотрение дедукции становится невозможным.
Другое, более специальное затруднение иллюстрируется частным случаем математической индукции. Мы хотим быть в состоянии сказать: ‘Если n является конечным целым числом, то n имеет все свойства, предполагаемые 0 и числами, следующими за всеми теми числами, которые предполагают эти свойства’. Но здесь фраза ‘все свойства’ должна быть заменена некоторой другой фразой, которая закрыта для тех же самых возражений. Можно допустить, что фраза ‘все свойства, предполагаемые 0 и числами, следующими за всеми теми числами, которые предполагают эти свойства’ может быть законно обоснованной, даже если фраза ‘все свойства’ - нет. Но фактически это не так. Мы найдём, что фразы формы ‘все свойства, которые etc.’’ включают все свойства, для которых 'etc.’ может значимо yтверждаться или отрицаться, а не только те, которые фактически имеют какую-то рассматриваемую характеристику; ибо в отсутствии списка свойств, обладающих этой характеристикой, выказывание о всех свойствах, которые имеют эту характеристику, должно быть гипотетическим и иметь форму: ‘Всегда истинно, что если свойство имеет указанную характеристику, тогда etc.’ Таким образом, математическую индукцию prima facie невозможно сформулировать осмысленно, если фраза ‘все свойства’ лишена смысла. Как мы увидим позже, этого затруднения можно избежать; но сейчас мы должны рассмотреть законы логики, поскольку они являются гораздо более фундаментальными .
II. ВСЕ И КАКОИ-ТО
Задав высказывание, содержащее переменную о, скажем, о = о, мы можем утверждать, что оно имеет место для всех случаев, или же мы можем утверждать какой-то один из случаев, не уточняя, какой именно из примеров мы утверждаем. Это различие, грубо говоря, совпадает с различием между общим и частным изложением у Евклида. Общее изложение говорит нам нечто обо всех, например, треугольниках, тогда как частное изложение берёт один треугольник и утверждает это же самое относительно этого одного треугольника. Но выбранный треугольник - это какой-то треугольник, а не некоторый один специальный треугольник; поэтому, хотя по ходу доказательства имеют дело только с одним треугольником, это доказательство, тем не менее, сохраняет свою всеобщность. Если мы говорим: ‘Пусть АВС - треугольник, тогда стороны АВ и АС в совокупности больше, чем сторона ВС’, мы нечто говорим об одном треугольнике, а не обо всех треугольниках; но этот один треугольник абсолютно не определён и, следовательно, наше высказывание также абсолютно не определено. Мы утверждаем не какую-то одну определённую пропозицию, но неопределённую пропозицию из всех пропозиций, вытекающих из предположения, что АВС - это тот или иной треугольник. Это понятие неопределённости утверждения является весьма важным, и насущно необходимо не смешивать неопределённое утверждение с определённым утверждением, что одно и то же имеет место во всех случаях.
Различие между (1), утверждающим какое-то значение пропозициональной функции, и (2), утверждающим, что функция всегда истинна, подобно различию между общими и частными изложениями у Евклида прослеживается через всю математику. В любой цепи математического рассуждения объекты, свойства которых исследуются, являются аргументами какого-то значения некоторой пропозициональной функции. Для иллюстрации возьмём следующее определение:
‘Мы называем fx) непрерывной для х = а, если для каждого положительного числа s, отличного от 0, существует положительное число е, отличное от 0, такое, что для значений 8, которые численно меньше е, разность fa + d )- fa) численно меньше s’
Здесь функция f есть какая-то функция, для которой указанное выше высказывание имеет смысл; это высказывание есть высказывание о f и изменяется с изменением f Но это высказывание не является высказыванием о s, е или 8, поскольку рассматриваются все возможные значения последних, а не одно неопределённое значение. (В отношении е высказывание ‘Существует положительное число е, такое что etc.’ есть отрицание того, что отрицание ‘etc’ истинно для всех положительных чисел.) По этой причине, когда утверждается какое-то значение пропозициональной функции, аргумент (например,/выше) называется действительной переменной; в то же время, когда о функции говорится как о всегда истинной или как о не всегда истинной, аргумент называется мнимой переменной
. Таким образом, в указанном выше определении f есть действительная переменная, а s e или dсуть мнимые переменные.
Утверждая какое-то значение пропозициональной функции, мы просто будем говорить, что утверждаем пропозициональную функцию. Так, если мы излагаем закон тождества в форме ‘х = x’, мы утверждаем функцию ‘х = х’; т.е. мы утверждаем какое-то значение этой функции. Сходным образом можно было бы сказать, что мы отрицаем пропозициональную функцию, когда отрицаем какой-то её пример. Мы можем действительно утверждать пропозициональную функцию, только если, какое бы значение мы не выбрали, это значение является истинным; сходным образом мы можем подлинно отрицать её, только если, какое бы значение мы не выбрали, это значение является ложным. Отсюда, в общем случае, когда некоторые значения являются истинными, а некоторые - ложными, мы не можем ни утверждать, ни отрицать пропозициональную функцию
.
Если фх - пропозициональная функция, то посредством ‘(х).фх’ мы будем обозначать пропозицию ‘фх всегда истинно’. Сходным образом ‘(х, у).ф(х, у)’ будет обозначать ‘фх, у) всегда истинно’ и т.д. Тогда различие между утверждением всех значений и утверждением какого-то значения есть различие между (1) утверждением (х).фх и (2) утверждением фх, где х не определён. Последнее отличается от первого тем, что оно не может трактоваться как одна определённая пропозиция.
Различие между утверждением фх и утверждением (х).фх, я думаю, впервые подчёрк-нул Фреге
. Его довод в пользу явного введения этого различия совпадает с тем, что является причиной присутствия этого различия в практике математиков; а именно, что дедукция может быть действенной только в случае действительных, а не мнимых переменных. В случае доказательств Евклида это очевидно. Скажем, для рассуждения нам нужен некоторый один треугольник АВС, хотя и безразлично какой именно. Треугольник АВС является действительной переменной; и хотя он представляет собой какой-то треугольник, он остаётся одним и тем же треугольником на протяжении всего доказательства. Но в общем изложении треугольник является мнимой переменной. Если мы переходим к мнимой переменной, мы не можем осуществить какой-либо вывод и, поэтому, во всех доказательствах должны использоваться действительные переменные. Предположим (возьмём простейший случай), нам известно, что ‘фх всегда истинно’, т.е. ‘(х).фх’, и мы знаем, что ‘фх всегда влечёт ух’, т.е. ‘(х).{фх влечёт ух}’. Каким образом мы выведем ‘ух всегда истинно’? Мы знаем, что всегда истинно следующее: если фх - истинно, и если фх влечёт ух, то ух - истинно. Но у нас нет посылок в том смысле, что фх - истинно, и фх влечёт ух; у нас есть следующее: фх всегда истинно, и фх всегда влечёт ух. Для того чтобы осуществить наш вывод, мы должны перейти от ‘фх всегда истинно’ к фх, и от ‘фх всегда влечёт ух’ к ‘фх влечёт ух’, где этот х, оставаясь каким-то возможным аргументом, должен быть одинаковым в обоих случаях. Тогда, из ‘фх’ и ‘фх влечёт ух’ мы выводим ' ух’; таким образом, ух является истинным для любого возможного аргумента и, следовательно, истинным всегда. Стало быть, для того чтобы вывести ‘(х).ух’ из ‘(х).фх’ и '(x).{fx влечёт у}’, мы должны перейти от мнимой к действительной переменной, а затем вновь вернуться к мнимой переменной. Эта процедура требуется во всех математических рассуждениях, в которых осуществляется переход от утверждения о всех значениях одной или более пропозициональных функций к утверждению о всех значениях некоторой другой пропозициональной функции, как, например, при переходе от ‘все равнобедренные треугольники имеют равные углы при основании’ к ‘все треугольники, имеющие равные углы при основании, являются равнобедренными ’. В частности, этот процесс требуется при доказательстве Barbara и других модусов силлогизма. Другими словами, всякая дедукция оперирует действительными переменными (или константами).
Можно предположить, что мы могли бы вообще обойтись без мнимых переменных, ограничившись какой-то в качестве замены для все. Это, однако, не имеет места. Возьмём, например, определение непрерывной функции, процитированное выше. В этом определении s e или d должны быть мнимыми переменными. Мнимые переменные постоянно требуются в определениях. Возьмём, например, такое: ‘Целое число называется простым, когда оно не имеет целых делителей кроме 1 и себя самого’. Это определение неизбежно включает мнимую переменную формы: ‘Если n - целое число, отличное от 1 или заданного целого числа, то n не является делителем данного целого числа, для всех возможных значений n’.
Таким образом, различие между все и какой-то необходимо для дедуктивного рассуждения и проходит через всю математику; хотя, насколько я знаю, его важность оставалась незамеченной до тех пор, пока на неё не указал Фреге.
Для наших целей это различие имеет разную пользу, которая весьма значительна. В случае таких переменных как пропозиции или свойства ‘какое-то значение’ законно, тогда как ‘всякое значение’ - нет. Так, мы можем сказать: ‘р - истинно или ложно, где р есть какая-то пропозиция ’, хотя мы не можем сказать ‘Все пропозиции являются истинными или ложными’. Причина этого в том, что в первом случае мы просто утверждаем одну неопределённую пропозицию из пропозиций формы ‘р - истинно или ложно’, тогда как в последнем случае мы утверждаем (если что-то утверждаем) новую пропозицию, отличную от всех пропозиций формы ‘р - истинно или ложно’. Таким образом, ‘какое-то значение’ переменной мы можем принять в случае, где ‘всякое значение’ вело бы к рефлексивным ошибкам; ибо допущение ‘какого-то значения’ не создаёт таким способом новых значений. Следовательно, фундаментальные законы логики можно установить, рассматривая какую-то пропозицию, хотя мы и не можем осмысленно сказать, что они имеют место для всех пропозиций. Эти законы имеют, так сказать, частное, а не общее изложение. Не существует одной пропозиции, которая является, скажем, законом противоречия; существуют только различные примеры этого закона. О какой-то пропозиции р мы можем сказать: ‘р и не-р не могут быть обе истинными’; но не существует такой пропозиции как: ‘Каждая пропозиция р такова, чтор и не-р не могут быть обе истинными’.
Сходное объяснение применяется к свойствам. Мы можем говорить о каком-то свойстве х, но не о всех свойствах, поскольку тем самым порождались бы новые свойства. Так, мы можем сказать: ‘Если n есть конечное целое число, и если 0 обладает свойством f, и m + 1 обладает свойством f при условии, что им обладает т, отсюда следует, что n обладает свойством f’. Здесь нам не нужно уточнять f; f обозначает ‘какое-то свойство’. Но мы не можем сказать: ‘Конечное целое число определяется как число, которое имеет каждое свойство f, предполагаемое 0 и числами, следующими за теми числами, которые его предполагают’. Ибо здесь существенно рассмотреть каждое свойство
1, а не какое-то свойство; и в использовании такого определения мы предполагаем, что оно охватывает свойство, отличительное для конечных целых чисел, которое как раз и является разновидностью предпосылки, из которой, как мы видели, вытекают рефлексивные парадоксы.
В указанном выше примере необходимо избегать предположений обыденного языка, который не подходит для выражения требуемых различий. Суть дела может быть далее проиллюстрирована следующим образом: Если для определения конечных целых чисел необходимо использовать индукцию, она должна устанавливать определённые свойства конечных целых чисел, а не свойства двусмысленные. Но если f есть действительная переменная, высказывание ‘n имеет свойство f при условии, что f предполагается 0 и числами, следующими за теми числами, которые его предполагают’ приписывает n свойство, которое изменяется с изменением f, и такое свойство не может использоваться для определения класса конечных целых чисел. Мы хотим сказать: ‘“n есть конечное целое число” означает “Каким бы ни было свойство f, n обладает свойством f при условии, что f предполагается 0 и числами, следующими за теми числами, которые его предполагают”’. Но здесь f стало мнимой переменной. Чтобы сохранить её в качестве действительной переменной, мы должны были бы сказать: ‘Каким бы ни было свойство f, “n есть конечное целое число” означает: “n обладает свойством f при условии, что f предполагается 0 и числами, следующими за теми числами, которые его предполагают”’. Но здесь значение “n есть конечное целое число” изменяется с изменением f и, поэтому, такое определение невозможно. Этот случай иллюстрирует важный пункт, а именно, следующий: ‘Область
действительной переменной никогда не может быть меньше, чем вся пропозициональная функция, в которой встречается данная переменная’. То есть, если наша пропозициональная функция есть, скажем, ‘fx влечёт р’, утверждение этой функции будет означать ‘какое-то значение “fx влечёт р” является истинным’, но не ‘“какое-то значение fx является истинным” влечётр’. В последнем случае в действительности мы имеем ‘Все значения fx истинны’ и x является мнимой переменной.
III. ЗНАЧЕНИЕ И ОБЛАСТЬ ОБОБЩЕННЫХ ПРОПОЗИЦИИ
В этом разделе первым мы должны рассмотреть значение пропозиций, в которых встречается слово все, а затем, разновидность совокупностей, которые допускают пропозиции о всех их членах.
Название обобщённые пропозиции удобно дать не только тем пропозициям, которые содержат слово все, но также и тем, которые содержат слово некоторыіе (в неопределённо частном смысле). Пропозиция ‘fx иногда истинно’ эквивалентна отрицанию пропозиции ‘не-fx всегда истинно’; ‘Некоторые А суть В’ эквивалентно отрицанию того, что ‘Все А не суть В’; т.е. отрицанию того, что ‘Ни одно А не суть В’. Вопрос о том, можно ли найти интерпретации, которые отличают ‘fx иногда истинно’ от отрицания того, что ‘не-fx всегда истинно’, исследовать не нужно; ибо для наших целей мы можем определить 'fx иногда истинно’ как отрицание того, что ‘не-fx всегда истинно’. В любом случае два вида пропозиций требует один и тот же вид интерпретации и подлежат одинаковым ограничениям. В каждом случае есть мнимая переменная; и наличие мнимой переменной образует то, что я имею в виду под обобщённой пропозицией. (Заметим, что ни в одной пропозиции не может быть действительной переменной; ибо то, что содержит действительную переменную, есть пропозициональная функция, а не пропозиция.)
Первый вопрос, который необходимо задать в этом разделе, следующий: Как мы должны интерпретировать слово все в таких пропозициях как ‘Все люди смертны’? На первый взгляд можно подумать, что никаких затруднений нет, что ‘все люди’ - это совершенно ясная идея, и что о всех людях мы говорим, что они смертны. Но на эту точку зрения есть много возражений.
(1) Если эта точка зрения правильна, оказалось бы, что ‘Все люди смертны’ не может быть истинным, если людей нет. Однако, как утверждал м-р Брэдли
, ‘Правонарушители будут привлекаться к ответственности ’ вполне может быть истинным, даже если правонарушителей нет; следовательно, как он доказывает далее, мы вынуждены интерпретировать такие пропозиции как гипотетические, подразумевая ‘Если кто-то является правонарушителем , то он будет привлечён к ответственности’; т.е. ‘если х - правонарушитель, то х будет привлечён к ответственности’, где область значения, которую может иметь х, кем бы он ни был, определённо не ограничивается теми, кто действительно совершил правонарушение. Сходным образом ‘Все люди смертны’ будет означать ‘Если х - человек, то х смертен, где х может обладать каким-то значением в рамках определённой области’. Что представляет собой эта область, остаётся определить; но в любом случае она шире, чем ‘человек’, ибо указанное выше гипотетическое высказывание часто определённо истинно, когда х не является человеком.
(2) ‘Все люди’ - это обозначающая [denoting] фраза; и по причинам, которые я выдвинул в другом месте
, кажется, что обозначающие фразы никогда не обладают значением в изоляции, но лишь входят в качестве конституент в вербальное выражение пропозиций, которые не содержат конституент, соответствующих рассматриваемым обозначающим фразам. Другими словами, обозначающая фраза определяется посредством пропозиций, в чьём вербальном выражении она встречается. Следовательно, невозможно, чтобы эти пропозиции приобретали своё значение через обозначающие фразы; мы должны найти независимую интерпретацию пропозиций, содержащих такие фразы, и не должны использовать эти фразы в объяснении того, что означают такие пропозиции. Поэтому, мы не можем рассматривать ‘Все люди смертны’ как высказывание о ‘всех людях’.
(3) Даже если бы такой объект как ‘все люди’ существовал, ясно, что это не тот объект, которому мы приписываем смертность, когда говорим ‘Все люди смертны’. Если бы мы приписывали смертность этому объекту, мы должны были бы сказать ‘Все люди смертны’. Стало быть, предположение, что такой объект как ‘все люди’ существует, не поможет нам в интерпретации ‘Все люди смертны’.
(4) Кажется очевидным, что если мы встречаем нечто такое, что может быть человеком или замаскированным ангелом, то это нечто входит в сферу ‘Все люди смертны’, чтобы утверждать ‘Если это нечто - человек, то это нечто - смертно’. Таким образом, как и в случае с правонарушителями, вновь становится ясным, что мы на самом деле говорим ‘Если нечто является человеком, то это нечто - смертно’, и что вопрос о том, является то или это человеком не входит в сферу нашего утверждения, как это было бы, если все действительно указывало бы на ‘все люди’.
(5) Таким образом, мы пришли к точке зрения, что то, что подразумевается под ‘Все люди смертны’ более явно может быть установлено в какой-то форме, типа следующей: ‘Всегда истинно, что если х - человек, то х смертен’. Здесь мы должны провести исследование относительно слова всегда.
(6) Очевидно, что всегда включает некоторые случаи, в которых х не является человеком, как мы видели в примере с замаскированным ангелом. Если х был бы ограничен до случая, когда х является человеком, мы могли бы вывести, что х - смертен, поскольку, если х - человек, то х - смертен. Поэтому, с тем же самым значение слова всегда мы нашли бы ‘Всегда истинно, что х - смертен’. Но ясно, что без изменения значения всегда, эта новая пропозиция является ложной, хотя другая была истинной.
(7) Можно понадеяться, что ‘всегда’ означало бы ‘для всех значений х’. Но выражение ‘все значения х’, если оно и законно, включало бы в качестве части выражения ‘все пропозиции ’ и ‘все функции’ и соответствующие им не оправданные целостности. Следовательно , значение х должно быть как-то ограничено в рамках некоторой узаконенной целостности. Это, по-видимому, ведёт нас к традиционной доктрине ‘универсума рассуждения’, в рамках которого, как предполагается, расположен х.
(8) Однако, весьма существенно, что мы должны обладать некоторым значением слова всегда, которое не должно выражаться в ограничительном условии относительно х. Ибо, предположим, что ‘всегда’ означает ‘всякий раз, когда х принадлежит классу i’. Тогда ‘Все люди смертны’ становится ‘Всякий раз, когда х принадлежит классу i, если х -человек, то х - смертен’. Но что должно означать наше новое всегда" По-видимому, для ограничения х до класса i в этой новой пропозиции причин не более, чем их было до этого при ограничении х до класса людей. Таким образом, если мы не можем обнаружить некоторое естественное ограничение на возможные значения функции (т.е. некоторое ограничение заданное функцией) ‘если х - человек, то х - смертен’, и оно не навязывается нам извне, мы перейдём к новому, более широкому универсуму и т.д. ad infinitum.
(9) По-видимому, очевидно, что, поскольку все люди смертны, то какой-то ложной пропозиции, являющейся значением функции ‘если х - человек, то х - смертен’ быть не может. Ибо, если она вообще является пропозицией, условие ‘х - человек’ должно быть пропозицией, таковой должно быть и следствие ‘х - смертен’. Но, если условие - ложно, условное высказывание - истинно; а если данное условие истинно, то это условное высказывание - истинно. Следовательно, ложной пропозиции формы ‘если х - человек, то х - смертен’ быть не может.
(10) Отсюда следует, что если какие-то значения х должны быть исключены, они могут быть только такими значениями, для которых нет пропозиции формы ‘если х - человек, то х - смертен’; т.е. для которых эта фраза является бессмысленной. Поскольку, как мы видели в (7), эти значения х должны быть исключены, отсюда следует, что функция ‘если х - человек, то х - смертен’ должна иметь определённую область значимости [range of significance]
, которой не хватает для всех воображаемых значений х, хотя она и превосходит те значения, которые являются людьми. Таким образом, ограничение на х есть ограничение до области значимости функции ‘если х - человек, то х - смертен’.
(11) Итак, мы приходим к выводу, что ‘Все люди смертны’ означает ‘Всегда, если х -человек, то х - смертен’, где всегда означает ‘для всех значений функции “если х - человек, то х - смертен”’. Это - внутреннее ограничение на х, заданное природой функций; и это ограничение не требует явного высказывания, поскольку для функции невозможно быть истинной способом более общим, нежели быть истинной для всех её значений.
Кроме того, если область значимости функции есть i, то функция ‘если х есть i, то если х - человек, то х - смертен’ имеет ту же самую область значимости, поскольку она не может быть значимой, если значимой не является её конституента ‘если х - человек, то х -смертен’. Но здесь область значимости снова является скрытой, как это было в “если х -человек, то х - смертен”. Поэтому, мы не можем сделать области значимости явными, поскольку попытка так поступить, приводит лишь к возникновению новой пропозиции, в которой эта же самая область значимости является скрытой.
Итак, в общем виде: ‘(х).фх’ должно означать ‘всегда фх’. Это можно интерпретировать, хотя и с меньшей точностью, как ‘фх всегда истинно’, или, более явно, как ‘Все значения функции фх истинны’
. Таким образом, основополагающее все есть ‘все значения пропозициональной функции’, и любое другое все производно от этого. И каждая пропозициональная функция имеет определённую область значимости, в рамках которой расположены аргументы, для которых функция имеет значения. В рамках этой области аргументов функция является истинной или ложной; вне этой области она бессмысленна.
Приведённую выше аргументацию можно суммировать следующим образом:
Затруднение, которое окружает попытки ограничить переменную, заключается в том, что ограничение естественным образом выражает себя как условие, что переменная относится к такому-то и такому-то виду, и что при таком выражении результирующее условное высказывание свободно от преднамеренного ограничения. Например, попробуем ограничить переменную до людей, и утверждать (а это подпадает под данное ограничение), что ‘х - смертен’ всегда истинно. Тогда то, что всегда истинно, состоит в том, что если х - человек, то х - смертен; и это условное высказывание истинно даже тогда, когда х не является человеком. Таким образом, переменная никогда не ограничена рамками определённой области, если пропозициональная функция, в которой встречается переменная, остаётся значимой тогда, когда переменная находится вне этой области. Но если функция перестаёт быть значимой, когда переменная выходит за рамки определённой области, то переменная ipso facto заключена в этой области без необходимости в каком-то явном высказывании этого. Этот принцип необходимо принимать во внимание при развитии логических типов, к которым мы вскоре перейдём.
Теперь мы можем начать рассмотрение того, каким образом случается так, что ‘все такие-то и такие-то’ иногда является оправданной фразой, а иногда - нет. Предположим, мы говорим: ‘Все элементы, имеющие свойство ф, имеют свойство у. Согласно указанной выше интерпретации это означает ‘фх всегда влечёт ух’. При условии, что область значимости фх является той же самой, что и область значимости ух, это высказывание является значимым; таким образом, если задать какую-то определённую функцию фх, то существует пропозиция, говорящая о ‘всех элементах, выполняющих фх’. Но иногда (как мы увидим позже) случается так, что то, что вербально проявляется как одна функция, на самом деле представляет собой много аналогичных функций с различными областями значимости. Это, например, применимо к ‘р - истинно’, которая, как мы найдём, на самом деле есть не одна функция от р, но представляет собой различные функции, соответствующие виду пропозиции, которой является р. В таком случае фраза, выражающая неопределённую функцию может, благодаря этой неопределённости, быть значимой во всём множестве значений аргумента, превосходящим область значимости какой-то одной функции. В этом случае все не обоснованно. Стало быть, если мы пытаемся сказать ‘Все истинные пропозиции обладают свойством ф’, т.е. ‘“р - истинно” всегда влечёт фр’, возможные аргументы для “р - истинно” необходимо превышают возможные аргументы для f и, следовательно, рассматриваемое общее высказывание невозможно. По этой причине подлинных общих высказываний о всех истинных пропозициях сделать нельзя. Однако может случиться, что предполагаемая функция f подобно “р - истинно” является неопределённой, и если случится, что она обладает неопределенностью точно такого же вида, как и “р - истинно”, мы всегда будем в состоянии задать интерпретацию для пропозиции “р - истинно” влечёт фр\ Это произойдёт, например, если fp есть ‘не-p - ложно’. Таким образом, в этих случаях мы получаем видимость общих пропозиций, рассматривающих все пропозиции; но эта видимость своим появлением обязана систематической неопределенности таких слов как истинно и ложно. (Эта систематическая неопределенность вытекает из иерархии пропозиций, которая будет объяснена позднее.) Во всех таких случаях мы можем высказаться о какой-то пропозиции, поскольку значение неопределённых слов будет приспосабливаться к этой какой-то пропозиции. Но если мы преобразуем нашу пропозицию с помощью мнимых переменных и нечто скажем обо всём, мы должны предполагать неопределенность слов, зафиксированную в том или ином возможном смысле, хотя может быть совершенно безразлично то, каким из своих возможных смыслов они должны обладать. Вот так и случается, что высказывания обо всех имеют ограничения, которые исключают ‘все пропозиции’ и, тем не менее, одновременно кажутся истинными высказываниями обо ‘всех пропозициях ’. Оба этих пункта станут яснее, когда будет объяснена теория типов.
Часто предполагалось*, что для того, чтобы обоснованно говорить о всех элементах совокупности, требуется, чтобы совокупность была конечной. Так, ‘Все люди смертны’ обоснованно, поскольку люди образуют конечный класс. Но на самом деле, это не причина, по которой мы можем говорить о ‘всех людях’. Как видно из приведённого выше обсуждения, существенна не конечность, но то, что можно было бы назвать логической однородностью. Это свойство должно принадлежать любой совокупности, чьи элементы суть все элементы, содержащиеся в рамках области значимости некоторой одной функции. Если дело не в скрытой неопределённости общих логических терминов, таких как истинно и ложно, которая придаёт видимость единой функции тому, что на самом деле является конгломератом многих функций с различными областями значимости, то с первого взгляда всегда видно, предполагает совокупность это свойство, или же нет.
Выводы этого раздела заключаются в следующем: Каждая пропозиция, содержащая все, утверждает, что некоторая пропозициональная функция всегда истинна; и это подразумевает, что все значения указанной функции являются истинными, но это не подразумевает, что функция является истинной для всех аргументов, поскольку есть аргументы, для которых какая-то данная функция является бессмысленной, т.е. не имеет значения. Следовательно, мы можем говорить о всех элементах совокупности тогда и только тогда, когда совокупность образует часть или целое области значимости некоторой пропозициональной функции, где область значимости определяется как совокупность тех аргументов, для которых рассматриваемая функция является значимой, т.е. имеет значение [value].
IV. ИЕРАРХИЯ ТИПОВ
Тип определяется как область значимости пропозициональной функции, т.е. как совокупность аргументов, для которых указанная функция имеет значения. Всегда, когда в
пропозиции встречается мнимая переменная, область значений мнимой переменной является типом; тип фиксируется функцией, относительно которой рассматриваются ‘все значения’. Необходимость различения объектов на типы вызвана рефлексивными недоразумениями , которые возникают, если такого различия не провести. Как мы видели, эти недоразумения следует избегать с помощью того, что может быть названо ‘принципом порочного круга’; т.е. ‘целостность не может содержать элементы, определённые в терминах её самой’. В нашем техническом языке этот принцип становится следующим: ‘То, что содержит мнимую переменную, не должно быть возможным значением этой переменной’. Таким образом, всё, что содержит мнимую переменную, должно относится к типу, отличному от возможных значений этой переменной; мы будем говорить, что оно относится к более высокому типу. Таким образом, мнимые переменные, содержащиеся в выражении, суть то, что определяет его тип. Это - ведущий принцип в дальнейшем изложении.
Пропозиции, которые содержат мнимые переменные, возникают из пропозиций, не содержащих этих мнимых переменных, посредством процессов, один из которых всегда является процессом обобщения, т.е. подстановкой переменной вместо одного из терминов пропозиции и утверждением результирующей функции для всех возможных значений этой переменной. Следовательно, пропозиция называется обобщённой, когда она содержит мнимую переменную. Пропозицию, не содержащую мнимых переменных, мы будем называть элементарной пропозицией. Ясно, что пропозиция, содержащая мнимые переменные предполагает другие пропозиции, из которых она может быть получена посредством обобщения; следовательно, все обобщённые пропозиции предполагают элементарные пропозиции. В элементарной пропозиции мы можем различить один или более членов от одного или более понятий; члены суть то, что может рассматриваться как субъект пропозиции, тогда как понятия являются предикатами или отношениями, утверждаемыми относительно этих терминов
. Члены элементарных пропозиций мы будем называть индивидами; они образуют первый или низший тип.
На практике не обязательно знать, какие объекты принадлежат низшему типу; необязательно даже знать, является ли низший тип переменных, встречающихся в данном контексте, типом индивидов, или же каким-то другим. Ибо на практике имеют значение только относительные типы переменных; поэтому, низший тип, встречающийся в данном контексте, может быть назван типом индивидов постольку, поскольку рассматривается этот контекст. Отсюда следует, что приведённое выше рассмотрение индивидов не существенно для истинности того, что идёт далее; существенен только способ, которым из индивидов производятся другие типы. Тем не менее, тип индивидов можно образовать.
Применяя процесс обобщения к индивидам, входящим в элементарные пропозиции, мы получаем новые пропозиции. Обоснованность этого процесса требует только того, чтобы индивиды не были пропозициями. То, что это так, должно обеспечиваться смыслом, который мы придаём слову индивид. Мы можем определить индивид как нечто лишённое комплексности; тогда очевидно, что он не является пропозицией, поскольку пропозиции существенно комплексны. Следовательно, в применении процесса обобщения к индивидам мы не подвержены риску впасть в рефлексивные недоразумения.
Элементарные пропозиции в совокупности с теми пропозициями, которые в качестве мнимых переменных содержат только индивиды, мы будем называть пропозициями первого порядка. Они образуют второй логический тип.
Таким образом, мы имеем новую целостность, целостность пропозиций первого порядка. Стало быть, мы можем образовать новые пропозиции, в которые первопорядковые пропозиции входят как мнимые переменные. Их мы будем называть пропозициями второго порядка; они образуют третий логический тип. Так, например, если Эпименид утверждает ‘Все пропозиции первого порядка, утверждаемые мной, ложны’, он утверждает пропозицию второго порядка; он действительно может ею утверждать, не утверждая в действительности какой-то первопорядковой пропозиции и, поэтому, противоречия не возникает.
Указанный выше процесс можно продолжать бесконечно. n + 1-ый логический тип будет состоять из пропозиций порядка п, которые будут включать пропозиции порядка n - 1, но не более высокого порядка, чем порядок мнимых переменных. Полученные таким образом типы взаимоисключающи и, поэтому, рефлексивные недоразумения невозможны до тех пор, пока мы помним, что мнимые переменные должны всегда ограничиваться рамками некоторого одного типа.
На практике иерархия функций более удобна, чем иерархия пропозиций. Функции различных порядков могут быть получены из пропозиций различных порядков методом подстановки. Если р - пропозиция, и а - конституентар, то пусть ‘р/а’х’ означает пропозицию, которая получается при подстановке х вместо а везде, где а входит в р. Тогда р/а, которую мы будем называть матрицей, может занять место функции; её значение для аргумента х есть р/а’х, а её значение для аргумента а есть р. Сходным образом, если ‘р/(а, Ь)’(х, у)’ означает результат первой подстановки х вместо а, а затем подстановки у вместо b, мы можем использовать двухместную матрицу р/(а, b) для того, чтобы представить двухместную функцию. Этим способом мы можем избежать мнимых переменных, отличных от индивидов и пропозиций различных порядков. Порядок матрицы будет определяться как порядок пропозиции, в которой произведена подстановка, а саму эту пропозицию мы будем называть прототипом. Порядок матрицы не определяет её тип: во-первых, потому что она не определяет число аргументов, вместо которых должны быть подставлены другие аргументы (т.е. имеет ли матрица форму р/а, р/(а, b) или р/(а, b, с)’ т.д.); во-вторых, потому что, если прототип относится к более высокому, чем первый, порядку, аргументы могут быть либо пропозициями, либо индивидами. Но ясно, что тип матрицы всегда определим посредством иерархии пропозиций.
Хотя и возможно заменить функции матрицами, и хотя эта процедура вводит определённое упрощение в объяснение типов, она технически неудобна. Технически удобно заменить прототип р на фа и заменить р/а’х на фх; таким образом, там, где как мнимые переменные появлялись бы р и а, если бы применялась матрица, в качестве нашей мнимой переменной мы теперь имеем ф. Для оправдания ф в качестве мнимой переменной необходимо, чтобы её значения ограничивались пропозициями некоторого одного типа. Поэтому, мы продолжаем следующим образом.
Функция, чьим аргументом является индивид и чьим значением всегда является пропозиция первого порядка, будет называться функцией первого порядка. Функция, включающая первопорядковую функцию или пропозицию в качестве мнимой переменной будет называться второпорядковой функцией и т.д. Функция от одной переменной, относящаяся к порядку следующему за порядком её аргумента будет называться предикативной функцией; такое же название будет даваться функции от нескольких переменных, если среди этих переменных есть переменная, в отношении которой функция становится предикативной, когда значения приписываются всем другим переменным. Тогда тип функции определяется типом её значений и числом и типом её аргументов.
Далее иерархия функций может быть объяснена следующим образом. Функция первого порядка от индивида х будет обозначаться как ф!х (для функций будут также использоваться буквы у, с, ?, /, g, F, G). Не первопорядковые функции содержат функцию в качестве мнимой переменной; следовательно, такие функции образуют вполне определённую целостность, и ф в f!х может быть преобразована в мнимую переменную. Любая пропозиция, в которой f появляется как мнимая переменная и в которой нет мнимых переменных более высокого, чем f типа, является пропозицией второго порядка. Если такая пропозиция содержит индивид х, она не является предикативной функцией от х; но если она содержит первопорядковую функцию f, она является предикативной функцией от f и будет записываться как /.(у! z). Тогда/есть предикативная функция второго порядка; возможные значения / снова образуют вполне определённую целостность, и мы можем преобразовать / в мнимую переменную. Таким образом, мы можем определить предикативные функции третьего порядка, которые будут представлять собой функции, имеющие в качестве значений пропозиции третьего порядка, а в качестве аргументов второпорядковые предикативные функции. Этим путём мы можем продвигаться до бесконечности . В точности такое же развитие сюжета относится к функциям от нескольких переменных.
Мы будем применять следующие соглашения. Переменные самого низкого типа, встречающиеся в любом контексте, будут обозначаться строчными латинскими буквами (за исключением / и g, которые зарезервированы для функций); предикативная функция от аргумента х (где х может быть любого типа) будет обозначаться как ф!х (где у, с, ?, f g, F, G могут заменять f); сходным образом предикативная функция от двух аргументов х и у будет обозначаться как f!(х, у); общая функция от х будет обозначаться как фх, а общая функция от х и у как Ф(х, у). В Фх f нельзя преобразовать в мнимую переменную, поскольку её тип не определён; но в ф!х, где ф является предикативной функцией, чей аргумент относится к некоторому заданному типу, ф можно преобразовать в мнимую переменную.
Важно заметить, что поскольку существуют различные типы пропозиций и функций и поскольку обобщение может быть применено только в рамках некоторого одного типа, все фразы, содержащие слова ‘все пропозиции’ или ‘все функции’ prima facie бессмысленны, хотя в определённых случаях они могут быть интерпретированы как не вызывающие возражений. Противоречия возникают при использовании таких фраз, где нельзя обнаружить простого значения.
Если теперь вернуться к парадоксам, мы сразу же увидим, что некоторые из них разрешаются теорией типов. Всегда, когда упоминаются ‘все пропозиции’, мы должны подставить ‘все пропозиции порядка п’, где безразлично, какое значение мы придаём п, но существенно, чтобы п имело некоторое значение. Таким образом, когда человек говорит ‘Y сейчас лгу’, мы должны интерпретировать сказанное им как означающее: ‘Существует пропозиция порядка п, которую я утверждаю и которая является ложной’. Это является пропозицией порядка п + 1; следовательно, его высказывание является ложным и, однако, его ложность не влечёт (как, по-видимому, влечёт ‘Y сейчас лгу’), что он делает истинное высказывание. Это разрешает парадокс лжеца.
Рассмотрим теперь ‘наименьшее целое число, не именуемое менее чем десятью словами’. Прежде всего, необходимо заметить, что именуемость должна означать ‘именуемо посредством таких-то и таких-то приписанных имён’, и что число приписанных имён должно быть конечно. Ибо если бы оно не являлось конечным, не было бы причин не существования целого числа, не именуемого менее, чем десятью словами, и парадокс устранялся бы. Далее мы можем предположить, что ‘именуемый в терминах имён класса N означает ‘является единственным термином, выполняющим некоторую функцию, всецело составленным из имён класса N’. Решение этого парадокса лежит, я думаю, в простом наблюдении, что ‘именуемый в терминах имён класса N само никогда не именуемо в терминах имён этого класса. Если мы расширяем N, добавляя имя ‘именуемый в терминах имён класса N, то расширяется наш основной аппарат имён; если этот новый аппарат назвать N, то ‘именуемый в терминах имён класса N’ остаётся не именуемым в терминах имён класса N. Если мы попытаемся расширять N до тех пор, пока он не охватить все имена, то ‘именуемый’ становится (согласно тому, что говорилось ранее) ‘является единственным термином, выполняющим некоторую функцию, всецело составленным из имён’. Но здесь в качестве мнимой переменной фигурирует функция; следовательно, мы ограничены до предикативной функции некоторого одного типа (ибо непредикативные функции не могут быть мнимыми переменными). Следовательно, для того, чтобы избежать парадокса, нам нужно лишь видеть, что именуемость с точки зрения таких функций является непредикативной.
Случай с ‘наименьшим неопределимым ординалом ’ вполне аналогичен случаю, который мы только что обсуждали. Здесь, как и ранее, ‘определимый ’ должно быть соотнесено с некоторым заданным аппаратом основополагающих идей; и есть причина предполагать, что ‘определимый в терминах идей класса N’ не определимо с точки зрения идей класса N. Верным будет то, что существует некоторый определённый сегмент ряда ординалов, всецело состоящий из определимых ординалов, и имеющий в качестве границы наименьший неопределимый ординал. Этот наименьший неопределимый ординал будет определим посредством незначительного расширения нашего основного аппарата; но тогда будет новый ординал, который будет наименьшим ординалом, неопределимым в этом новом аппарате. Если мы расширяем наш аппарат с тем, чтобы включить все возможные идеи, то более нет какой-то причины думать, что существует какой-то неопределимый ординал. Я думаю, что мнимая сила парадокса по большей части лежит в предположении, что если все ординалы определённого класса определимы, должен быть определим и этот класс, а в этом случае определим также и класс следующий за ним; но для принятия этого предположения причин нет.
Другие парадоксы, в частности, парадокс Бурали-Форти, для своего решения требуют некоторого дальнейшего развития темы.
V. АКСИОМА СВОДИМОСТИ
Пропозициональная функция от о, как мы видели, должна относиться к какому-то порядку; следовательно, любое высказывание о ‘всех свойствах о’ бессмысленно. (‘Свойство о’ есть то же самое, что и ‘пропозициональная функция, имеющая силу для о’.) Но для возможности математики абсолютно необходимо иметь некоторый метод делать высказывания, которые были бы эквивалентны тому, что мы подразумеваем, когда (некорректно) говорим о ‘всех свойствах о’. Эта необходимость проявляется во многих случаях, но особенно в связи с математической индукцией. Мы можем сказать, используя какое-то вместо все, ‘Какое-то свойство, предполагаемое 0 и числами, следующими за всеми числами его предполагающими, предполагается всяким конечным числом’. Но мы не можем перейти к ‘Конечное число - это число, которое предполагает все свойства, предполагаемые 0 и числами, следующими за всеми числами, их предполагающими ’. Если мы ограничиваем это высказывание до всех первопорядковых свойств чисел, мы не можем вывести, что оно имеет силу для всех второпорядковых свойств. Н апример, мы не в состоянии доказать, что если m и n являются конечными числами, то m + n является конечным числом. Ибо, согласно данному выше определению, ‘m есть конечное число’ является второпорядковым свойством m; следовательно, тот факт, что m + 0 есть конечное число, и что если m + n есть конечное число, то таковым является и m + n + 1, не позволяет нам вывести по индукции, что m + n есть конечное число. Очевидно, что такое положение дел представляет многое из элементарной математики невозможным.
Или возьмём определение конечности через несовпадение целого и части, что ничуть не облегчает дело. Ибо это определение состоит в следующем: ‘Говориться, что класс конечен, когда каждое одно-однозначное отношение, чьей областью является данный класс и чья конверсная область содержится в этом классе, имеет весь класс в качестве своей конверсной области’. Здесь появляется переменное отношение, т.е. переменная функция от двух переменных; мы должны взять все значения этой функции, а это требует, что она должна относится к некоторому приписанному порядку; но никакой приписанный порядок не позволит нам вывести многие из пропозиций элементарной математики.
Следовательно, мы должны отыскать, если возможно, некоторый метод сведения порядка пропозициональной функции, не воздействуя на истинность и ложность её значений. По-видимому, этого достигает здравый смысл введением классов. Если взять какую-то пропозициональную функцию фх любого порядка, предполагается, что для всех значений х она эквивалентна высказыванию формы ‘х принадлежит классу а\ Это высказывание относится к первому порядку, поскольку оно не делает отсылок к ‘все функции такого-то и такого-то типа’. И действительно, его единственное практическое преимущество перед первоначальным высказыванием фх состоит в том, что оно относится к первому порядку. В предположении, что действительно существуют такие вещи как классы, преимуществ нет, и противоречие относительно классов, не являющихся членами самих себя это показывает; если классы существуют, они должны быть чем-то радикально отличным от индивидов. Я полагаю, что главная цель, которой служат классы, и главная причина, которая делает их лингвистически удобными, состоит в том, что они обеспечивают метод сведения порядка пропозициональной функции. Следовательно, я не буду допускать ничего, что, по-видимому, подразумевается при допущении классов здравым смыслом, за исключением следующего: Каждая пропозициональная функция для все своих значений эквивалентна некоторой предикативной функции.
Это допущение в отношении функций необходимо принять независимо от типа их аргументов. Пусть фх - функция какого-то порядка от аргумента х, который сам может быть либо индивидом, либо функцией какого-то порядка. Если ф относится к порядку следующему за х, мы записываем функцию в форме ф!х, в этом случае мы будем называть ф предикативной функцией. Таким образом, предикативная функция от индивида является функцией первого порядка; для более высоких типов аргументов предикативные функции занимают место, которое первопорядковые функции занимают в отношении индивидов. Затем, мы предполагаем, что каждая функция для всех своих значений эквивалентна некоторой предикативной функции от тех же самых аргументов. Это допущение, по-видимому, является сутью обычного допущения классов; во всяком случае, оно сохраняет от классов столь много, чтобы мы могли их как-то использовать, и достаточно мало, чтобы избежать противоречий, которые охотно предполагают классы. Мы будем называть это допущение аксиомой классов или аксиомой сводимости.
Мы будем предполагать, что каждая функция от двух переменных эквивалентна для всех своих значений предикативной функции от этих переменных, где предикативная функция от двух переменных такова, что в отношении одной из переменных функция становится предикативной (в нашем предыдущем смысле), когда значение приписывается другой переменной. Это допущение, по-видимому, и подразумевается, когда говорят, что любое высказывание о двух переменных определяет отношение между ними. Это допущение мы называем аксиомой отношений или аксиомой сводимости. Если иметь дело с отношениями между более, чем двумя элементами, нужны сходные допущения для трёх, четырёх ... переменных. Но эти допущения для нашей цели не являются необходимыми, поэтому, они и не принимаются в данной статье.
С помощью аксиомы сводимости, высказывания обо ‘всех первопорядковых функциях от х’ или ‘всех предикативных функциях от a’ охватывают большинство результатов, которые иначе требовали бы высказываний о ‘всех функциях’. Существенный пункт состоит в том, что такие результаты получаются во всех случаях, где уместна только истинность или ложность значений рассматриваемых функций, а этот случай в математике постоягнен. Таким образом, математическая индукция, например, нуждается теперь только в том, чтобы быть установленной для всех предикативных функций от чисел; тогда из аксиомы классов следует, что она имеет силу для любой функции любого порядка. Можно подумать, что парадоксы, ради которых мы изобрели иерархию типов, появятся вновь. Но это не тот случай, поскольку в таких парадоксах либо затрагивается ещё что-то помимо истинности и ложности значений функций, либо встречаются выражения, которые остаются без значения даже после введения аксиомы сводимости. Например, такое высказывание как ‘Эпименид утверждает ух’ не эквивалентно ‘Эпименид утверждает f!х’, даже если ус и ф!х эквивалентны. Таким образом, ‘Я сейчас лгу’ остаётся без значения, если мы пытаемся включить все пропозиции, в совокупность тех, которые я мог бы ложно утверждать, и не затрагивается аксиомой классов, если мы ограничиваем её до пропозиций порядка п. Иерархия пропозиций и функций, стало быть, остаётся уместной как раз в тех случаях, в которых необходимо избежать парадокса.
VI. ИСХОДНЫЕ ИДЕИ И ПРОПОЗИЦИИ СИМВОЛИЧЕСКОЙ ЛОГИКИ
Исходные идеи, которые требуются в символической логике, по-видимому, сводятся к следующим семи:
(1) Какая-то пропозициональная функция от переменной х или нескольких переменных х, у, z ... Она будет обозначаться как фх или ф(х, у, z, ...)
(2) Отрицание пропозиции. Если р - пропозиция, её отрицание будет обозначаться как ~р.
(3) Дизъюнкция или логическая сумма двух пропозиций, т.е. ‘это или то’. Еслир и q суть две пропозиции, их дизъюнкция будет обозначаться как pwq\
(4) Истинность какого-то значения пропозициональной функции; т.е. функции фх, где х не уточняется.
(5) Истинность всех значений пропозициональной функции. Это обозначается как (х).фх, или (х):фх; для заключения пропозиций в скобки может потребоваться и большее
число точек
. В (х).фх х называется мнимой переменной; когда фх утверждается, там, где о не уточнён, х называется действительной переменной.
(6) Какая-то предикативная функция от аргумента какого-то типа; по обстоятельствам она будет представлена как ф!х, ф!а или f!R. Предикативная функция от х - это функция, чьи значения являются пропозициями, относящимися к типу, следующему за типом х, если х является индивидом или пропозицией, или за типом значений х, если х является функцией. Она может быть описана как функция, в которой все мнимые переменные, если таковые есть, относятся к одному типу с х или к меньшему типу. Переменная относится к меньшему, чем х типу, если она может значимо встречаться как аргумент в самом х, или как аргумент в аргументе самого х и т.д.
(7) Утверждение; т.е. утверждение, что некоторая пропозиция является истинной, или что какое-то значение некоторой пропозициональной функции является истинным. Утверждение требуется для того, чтобы отличить действительно утверждаемую пропозицию от пропозиции просто рассматриваемой или от пропозиции, на которую ссылаются как на условие некоторой другой пропозиции. На утверждение будет указывать знак ‘ )-’, предпосланный тому, что утверждается, с достаточным количеством точек, чтобы заключить то, что утверждается, в скобки
.
Перед тем, как перейти к исходным пропозициям, нам нужны некоторые определения. В следующих определениях, также как и в исходных пропозициях, буквы p, q, r используются для обозначения пропозиций.
p з q . = . ~p v q Df.
Это определение устанавливает, что ‘p з q’ (которое прочитывается как р влечёт q’) должно означать р - ложно, или q - истинно’. Я не намереваюсь утверждать, что ‘влечёт’ не может иметь другого смысла, но утверждаю только то, что этот смысл наиболее подходит для того, чтобы задать ‘влечёт’ в символической логике. В определении знак равенства и буквы ‘Df
должны рассматриваться как один символ, совместно означая ‘значит по определению ’. Знак равенства без букв ‘Df
имеет иной смысл, который вскоре будет рассмотрен.
p . q . = . ~(~p v ~q) Df.
Это определяет логическое произведение двух пропозиций р и q, т.е. ‘р и q оба являются истинными’. Приведённое определение устанавливает, что это должно означать: ‘Ложно, что р - ложно, или q - ложно’. Здесь определение снова не даёт единственного смысла, который может быть придан ‘р и q оба являются истинными’, но задаёт значение, которое наиболее подходит для нашей цели.
p ° q . = . p з q . q з p Df.
То есть ‘p ° q’, которое читается как ‘р эквивалентно q’, означает ‘р влечёт q, и q влечётр’; откуда, конечно, следует, что р и q являются оба истинными или оба ложными.
(Зх) . фх . = . ~{(х) . ~фх} Df.
Это определяет ‘Существует по крайней мере одно значение х для которого фх является истинным’. Мы определяем последнее как означающее ‘Ложно, что фх всегда ложно’.
x = у. = : (ф) : ф!х . з . ф!у Df.
Это - определение равенства. Оно устанавливает, что х и у должны называться равными, когда каждая предикативная функция, выполняющаяся х, выполняется у. Из аксиомы сводимости следует, что если х выполняет ух, где у есть какая-то функция, предикативная или непредикативная, то у выполняет уу.
Следующие определения менее важны и вводятся только с целью сокращения.
и т.д. для любого числа переменных.
Требуются следующие исходные пропозиции (в 2, 3, 4, 5, 6 и 10 p, q, r обозначают пропозиции):
(1) Пропозиция, выведенная из истинной посылки, является истинной.
(2) -
(6) -(7) -
p ? p . з . p. q . з . p ? q. p ? q . з . q ? p. p ? (q ? r). з . q ? (p ? r).
. q з r. з : p ? q . з . p ? r. (х). фх . з . фу;
т.е. ‘если все значения фх являются истинными, то фу является истинным, где фу есть какое-то значение
(8) Если фу - истинно, где фу есть какое-то значение фх, то (х).фх - истинно. Этого нельзя выразить в наших символах; ибо, если мы записываем ‘фу . з . (х)фх’, это означает 'фу влечёт, что все значения фх являются истинными, где у может принимать любое значение подходящего типа’ , что в общем не имеет места. То, что мы намереваемся утверждать, заключается в следующем: ‘Если при любом выбранном у фу - истинно, то (х).фх -истинно’, тогда как то, что выражено посредством ‘фу . з . (х). фх’, есть ‘При любом вы-
бранном у, если фу - истинно, то (х).фх - истинно’, что является совершенно иным высказыванием, которое в общем случае ложно.
(9) L : (х) . фх. ^ . фа, где а есть какая-то определённая константа.
Это принцип на самом деле представляет собой много различных принципов, а именно, столько, сколько существует возможных значений а. Т.е. он устанавливает, например, что то, что имеет силу для всех индивидов, имеет силу для Сократа; а также, оно имеет силу для Платона; и т.д. Этот принцип состоит в том, что общее правило можно применить к частному случаю; но чтобы задать его область, необходимо упомянуть отдельные примеры, поскольку в противном случае нам нужен принцип, который сам заверят нас в общем правиле, что общие правила, которые могут применены к частному случаю, могут быть применены к отдельному случаю, скажем, к Сократу. Таким образом, этот принцип отличается от (7); данный принцип высказывается о Сократе, Платоне или какой-то другой константе, тогда как (7) высказывается о переменной.
Указанный принцип никогда не используется в символической логике или в чистой математике, поскольку все наши пропозиции являются общими. И даже тогда, когда (как в ‘один есть число’) мы, по видимости, имеем строго частный случай, при близком рассмотрении он не оказывается таковым. Фактически, применение этого принципа является отличительным признаком прикладной математики. Стало быть, строго говоря, мы должны исключить его из нашего списка.
(10) L : . (х) . р ? фх. ^ : р . ? . (х) . фх;
т.е., ‘если “р или фх” - всегда истинно, то илир - истинно, или фх - всегда истинно’.
(11) Когда /(фх) - истинно при любом возможном аргументе х, и F(фy) - истинно при любом возможном аргументе у, тогда {/(фх) . F($x)} является истинным при любом возможном аргументе х.
Это - аксиома ‘неопределённости переменных’. Она нужна, когда о каждой из двух отдельных пропозициональных функций известно, что они всегда являются истинными, и мы хотим вывести, что их логическое произведение всегда является истинным. Этот вывод оправдан только тогда, когда две функции принимают аргументы одного и того же типа, ибо, в противном случае, их логическое произведение бессмысленно.
(12) Если фх.фх^>ух - истинно для любого возможного х, то ух - истинно для любого возможного х.
Эта аксиома требуется для того, чтобы заверить нас в том, что область значимости ух, в предполагаемом случае, совпадает с областью значимости фх.фх^ух.^.ух; фактически, обе области совпадают с областью значимости фх. В предполагаемом случае мы знаем, что ух - истинно везде, где и фх.фх^>ух, и фх.фх^>ух.^>.ух являются значимыми, но без аксиомы мы не знаем, что ух - истинно, везде, где ух является значимым. Следовательно, эта аксиома нам необходима.
Аксиомы (11) и (12) требуются, например, при доказательстве
(х) . фх : (х). фх ^ ух : ^ . (х) . ух.
L : . (х) . фх : (х). фх ^ ух : ^ : фу. фу ^ уу,
L : . (х) . фх : (х). фх ^ ух : ^ : уу,
По (7) и (11)
отсюда, по (12) отсюда результат вытекает по (8) и (10).
(13) L : • (3f : • (x) : fx . ° . f.x.
Это - аксиома сводимости. Она устанавливает, что если задать какую-то функцию фх, то существует такая предикативная функция f х, что f.x всегда эквивалентна фх. Заметим, что поскольку пропозиция, начинающаяся с ‘(3/)’ по определению есть отрицание пропозиции, начинающейся с ‘(f)’, приведённая аксиома включает возможность рассмотрения ‘всех предикативных функций от х’. Если фх есть какая-то функция от х, мы не можем высказать пропозицию, начинающуюся с ‘(f)’ или ‘(3ф)’, поскольку мы не можем рассматривать ‘все функции’, но только ‘какую-то функцию’ или ‘все предикативные функции’.
(
14) L : •
($м
: •
(x У
): fx’ У
) • ° •
/(м У).
Это - аксиома сводимости для двухместной функции.
В приведённых выше пропозициях наши х и у могут относиться к любому типу. Единственное, где уместна теория типов, состоит в том, что (11) лишь позволяет нам отождествить действительные переменные, встречающиеся в различных содержаниях, когда демонстрируется, что они относятся к одному и тому же типу, поскольку в обоих случаях входят как аргументы одной и той же фунции, и что в (7) и (9) у и а, соответственно, должны относится к типу, подходящему для аргументов ф
х. Поэтому, если предположить, например, что у нас есть пропозиция формы (ф)/!(ф! z, x), являющаяся второпорядковой функцией от х, то по (7)
L : (ф) • f.(f!
х, x) • з .f.(y.
х, x),
где y! z есть какая-то функция первого порядка. Но (ф) • f!(f!
х, x) нельзя рассматривать так, как если бы она была первопорядковой функцией от х, и брать эту функцию как возможное значение у!
х в указанном выше выражении. Подобное смешение типов приводит к парадоксу лжеца.
Снова рассмотрим классы, которые не являются членами самих себя. Ясно, что поскольку мы отождествляем классы с функциями
, ни об одном классе нельзя значимо говорить, что он является или не является членом самого себя; ибо члены класса являются аргументами функции, а аргументы функции всегда относятся к типу, более низкому, чем функция. И если мы спросим: ‘Как обстоит дело с классом всех классов" Он что же, не является классом и, поэтому, членом самого себя?’, ответ двойственен. Во-первых, если ‘класс всех классов’ означает ‘класс всех классов любого типа’, то такого понятия нет. Во-вторых, если ‘класс всех классов’ означает ‘класс всех классов типа t’, то этот класс относится к типу, следующему за t, а, потому, снова не является членом себя самого.
Таким образом, хотя приведённые выше пропозиции равным образом применяются ко всем типам, они не позволяют нам вывести противоречия. Поэтому, в процессе какой-либо дедукции никогда не нужно рассматривать абсолютный тип переменной; необходимо лишь видеть, что различные переменные, встречающиеся в одной пропозиции, относятся к надлежащим соответствующим типам. Это исключает те функции, из которых было получено наше четвёртое противоречие, а именно: ‘Отношение R имеет силу между R и S’. Ибо отношение между R и S необходимо относится к более высокому типу, чем любое из них, так что предполагаемая функция является бессмысленной.
VII. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ КЛАССОВ И ОТНОШЕНИИ
Пропозиции, в которые входит функция ф, могут по своему истинностному значению зависеть от особой функции ф, или же они могут зависеть от объёма ф, т.е. от аргументов, которые выполняют ф. Функции последнего сорта мы будем называть экстенсиональными. Так, например, ‘Я верю, что все люди смертны’ не может быть эквивалентно ‘Я верю, что все беспёрые двуногие смертны’, даже если люди по объёму совпадают с двуногими беспёрыми; ибо я могу и не знать, что по объёму они одинаковы. Но ‘Все люди смертны’ должно быть эквивалентно ‘Все беспёрые двуногие смертны’, если люди по объёму совпадают с двуногими и беспёрыми. Таким образом, ‘Все люди смертны’ является экстенсиональной функцией от функции ‘о - человек’, тогда как ‘Я верю, что все люди смертны’ не является экстенсиональной функцией; мы будем называть функцию интенсиональной, когда она не является экстенсиональной. Функции от функций, с которыми особо имеет дело математика, все являются экстенсиональными. Признак экстенсиональной функции f от функции ф! z состоит в следующем:
ф!х . ° . y!x : зф, y : f ф!
х) . ° . fy!
х).
Из функции f от функции ф! z мы можем вывести соответствующую экстенсиональную функцию следующим образом. Пусть
f{
z (yz)}. = : ($ф): ф!х . °
x. yx : f{ф! z} Df.
Функция f{ z (yz)} фактически есть функция от y
z, хотя она и не совпадает с функцией f(y! z), предполагая, что эта последняя является значимой. Но трактовать так f{ z (yz)} технически удобно, хотя она и содержит аргумент z (yz), который мы называем ‘класс, определяемый посредством y’. Мы имеем
L : . фх . °. yx : з : f{ z (ф)}. °. f{ z (yz)},
следовательно, применяя определение тождества к фиктивным объектам z (ф) и z (yz), данное выше, мы находим, что
L : . фx. °
x. yx : з . z (ф) = z (yz).
Это утверждение, а также его конверсия (что также можно доказать), указывает отличительное свойство классов. Следовательно, мы вполне можем трактовать z (ф) как класс, определяемый посредством ф. Тем же самым способом мы устанавливаем
f{ х
z y(x, y)} . = : ($ф): ф!(.x, y). °
x,
y. y(x, y): f{ф!( x, P)} Df.
Здесь необходимо несколько слов относительно различия между ф!( х, у) и ф!( у, х). Мы будем принимать следующее соглашение: Когда функция (в противоположность своим значениям) представлена в форме, включающей х и у (или какие-то другие две буквы алфавита), значение этой функции для аргументов а и b должно обнаруживаться подстановкой а вместо х и b вместо у; т.е. аргумент, упоминающийся первым, должен подставляться вместо буквы, которая встречается в алфавите раньше, а аргумент, упоминающийся вторым, - вместо буквы, которая встречается позднее. И это вполне удовлетворительно проводит различие между ф!( х, у) и ф!( ?, х); например:
Значение ф!(х, у) для аргументов а и b есть ф!(а, b).
Значение f!(х, ?) для аргументов b и а есть f!(b, а).
Значение f!(
?, х) для аргументов а и b есть f!(b, а).
Значение ф!(у, х) для аргументов b и а есть ф!(а, b).
устанавливае :
хеф! z . = . ф!х Df.,
следовательно,
L : . хе z (yz). = : ($ф): ф!у. ° . yy : ф!х.
К тому же, по аксиоме сводимости мы имеем
($
ф) : ф!у • °у •
yy,
следовательно,
L : xez (yz) • ° • ух.
Это имеет силу при любом х. Предположим теперь, что мы хотим рассмотреть z (yz)e фf{
х (ф!г)}. Согласно изложенному выше, мы имеем
L : •
х (yz)e f
х ф)} • ° • f{
х (yz)} : ° : ($ф): ф!у • ° . yy :ф),
отсюда
L : •
х (yz) =
х (%z) • з : z (yz)ex • • z (%z)ex,
где х записывается вместо любого выражения формы фf{ z ф-z)}.
Мы устанавливаем:
cls = а {($ф} • а = z (ф!z)} Df.
Здесь cls обладает значением, которое зависит от типа мнимой переменной ф. Следовательно, пропозиция ‘cls е cls’, например, являющаяся следствием приведённого выше определения, требует, что ‘cls ’ должно обладать различным значением в двух местах, где оно встречается. Символ ‘cls ’ может использоваться только там, где необходимо знать тип; он обладает неопред елённостью, которая приспосабливается к обстоятельствам. Если мы вводим как неопределяемую функцию ‘Indiv!x’, означающую ‘x - индивид’, мы можем установить
Kl = а {($ф} • а = г (ф^ • Indiv!z)} Df.
Тогда, Kl - это определённый символ, означающий ‘класс индивидов’.
Мы будем использовать строчные буквы греческого алфавита (иные, чем е, ф, y, %, ?), чтобы представлять классы любого типа, т.е. обозначать символы формы z (фЬ) или
х (ф).
С этого пункта теория классов во многом развивается как в системе Пеано; z (ф) заменяет zЭ(фz). Также, я устанавливаю:
a c b. = : xea. з . xepDf.,
$!a. =. ($x) . xea Df.,
V = X (x = x)Df.,
Л = x {~(x = x)} Df.,
где Л, как и у Пеано, есть нуль-класс. Символы $, Л, V, как и символы cls и e, не определены, и приобретают определённое значение, когда рассматриваемый тип указан иным способом.
Отношения мы трактуем точно таким же способом, устанавливая
a{f!(
у, у)}b . = . f!(a, b) Df.
(порядок предопределён алфавитным порядком х и у и типографским порядком а и b); отсюда,
L : . a{
у у y(x, y)}b . ° : ($f): y(x, y). °x,y. f!(x, y): f!(a, b), откуда, по аксиоме сводимости,
L : a{
у у y(x, y)}b . ° . y(a, b).
Используя прописные буквы латинского алфавита в качестве сокращения для таких символов как
у у y(x, y) мы находим, что
L : . R = S. ° : xRy. °
x,
y. xSy, где
R = S. = : f.R . 3f.f.S Df.
Мы устанавливаем:
Rel = R {$f). R =
у у f!(x, y)} Df.
и находим, что всё, что доказывается для классов, имеет свой аналог для двухместных отношений. Следуя Пеано, мы устанавливаем:
anb =
у (xe a. xeb) Df.,
определяя произведение, или общую часть, двух классов;
aub =
у(xea. ? . xeb) Df.,
определяя су у двух классов и
- a = x {~(xe a)} Df.,
определяя отрицание класса. Сходным образом для отношений мы устанавливаем:
R nS =
? ?(xRy . xSy) Df.,
RиS =
x x(xRy . v . xSy) Df.,
- R = ? ? {~(xRy)} Df.
VIII. ДЕСКРИПТИВНЫЕ ФУНКЦИИ
Функции, рассмотренные до сих пор, за исключением нескольких отдельных функций, таких как R nS были пропозициональными. Но обычные функции математики, такие как o
2, sin x, log x, не являются пропозициональными. Функции этого вида всегда означают ‘элемент, имеющий такое-то и такое-то отношение к o’. По этой причине они могут быть названы дескриптивными [descriptive] функциями, поскольку они описывают [describe] определённый элемент через его отношение к их аргументам. Так, ‘sin к/2’ описывает число 1; однако пропозиции, в которых встречается к/2, не останутся теми же самыми, если бы в них было подставлено 1. Это, например, обнаруживается из пропозиции ‘sin к = 1’, которая содержит значимую информацию, тогда как ‘1 = 1’ - тривиально. Дескриптивные функции имеют значение не сами по себе, но только как конституенты пропозиций; и это вообще применяется к фразам формы ‘элемент, имеющий такое-то и такое-то свойство’. Следовательно, имея дело с такими фразами, мы должны определять какую-то пропозицию, в которую они входят, а не фразу саму по себе
. Таким образом, мы приходим к следующему определению, в котором \Ox)(fx)’ должно читаться как 'данный [the] элемент x, который выполняет fo’.
y{(Ox)(fx)} . = : (36) : fx . =
x. x=b : yb Df.
Это определение устанавливает, что ‘элемент, который выполняет f, выполняет у должно означать: ‘Существует термин b, такой что fo - истинно тогда и только тогда, когда o есть b, и yb - истинно’. Таким образом, все пропозиции об ‘данном таком-то и таком-то’ будут ложными, если такого-то и такого-то не существует или их существует несколько.
Общее определение дескриптивной функции является следующим:
R‘y = (Ox)(xRy) Df.;
т.е. ‘R'y’ должно означать ‘элемент, который имеет отношение R к у’. Если же существует несколько или не существует ни одного элемента, имеющего отношение R к у, то все пропозиции о R
y будут ложными. Мы устанавливаем:
E!(Dx)(fx). = : (3b) : fx . °
x. x=b Df.
Здесь ‘E!(/ix)(fx)’ может прочитываться ‘Существует такой элемент как o, который выполняет fo’ или ‘тот o, который выполняет fo, существует’. Мы имеем
L : . E!R'y . ° : (3b) : xRy . °
x. x=b.
Кавычка в R
iy может прочитываться. Так, если R - отношение отца к сыну, то ‘R‘y’ есть ‘отец у’. Если R - отношение сына к отцу, все пропозиции о R
iy будут ложными, если у не имеет ни одного или больше, чем одного, сына.
Из сказанного выше обнаруживается, что дескриптивные функции получаются из отношений. Определяемые теперь отношения главным образом важны для рассмотрения дескриптивных функций, которым они дают начало.
Cnv = QP {xQy .
y. yPx} Df.
Здесь Cnv есть сокращение для ‘конверсия’. Это определяет отношение некого отношения к своей конверсии; например, отношение отношения больше к отношению меньше, отношения отцовства к отношению сыновства, отношение предшественника к отношению наследника и т.д. Мы имеем
L . Cnv‘P = (DQ){xQy . °x,y . yPx}.
Для сокращения записи, что часто более удобно, мы устанавливаем:
P = Cnv‘P Df.
Нам требуется ещё одна запись для класса терминов, имеющих отношение R к у. С этой целью мы устанавливаем:
R = ар {а = х (xRy)} Df.,
отсюда,
¦ ——
L. R ‘y =
p (xRy).
Сходным образом мы устанавливаем:
—— A
R = b A {b = A (xRy)} Df.,
отсюда,
L . R ‘x =
p (xRy).
Далее нам требуется область R (т.е. класс элементов, имеющих отношение R к чему-либо), конверсная область R (т.е. класс элементов, к которым что-либо имеет отношение R), и поле R, представляющее собой сумму области R и конверсной области R. С этой целью мы определяем отношения области, конверсной области и поля к R. Определения таковы:
D = a R {а =
A(($y) . xRy)} Df.,
[D] = b R {Ь = A(($x) . xRy)} Df.,
C = g R {g = (($y) : xRy. v . yRx)} Df.
Заметим, что третье из этих определений значимо только тогда, когда R есть то, что можно было бы назвать однородным отношение; т.е. отношением, в котором, если xRy имеет место, х и у относятся к одному и тому же типу. В противном случае, как бы мы не выбирали х и у, либо xRy, либо yRx были бы бессмысленными. Это наблюдение важно в связи с парадоксом Бурали-Форти.
На основании приведённых определений мы получаем:
L. DR = $ {(3y) . xRy},
L . [D]R = $ {(3x) . xRy},
L. CR = $ {(3y) : xRy . v . yRx},
последнее будет значимо только тогда, когда R однородно. ‘D‘R’ читается как ‘область R’;
c[D]
iR’ читается как ‘конверсная область R’; ‘C‘R’ читается как ‘поле R’.
Далее нам требуется запись для отношения класса членов, к которым некоторый элемент из а имеет отношение R, к классу а, содержащемуся в области R, а также запись для отношения класса членов, которые имеют отношение R к некоторому элементу из 5, к классу 5, содержащемуся в конверсной области R. Для второй из них мы устанавливаем:
R
e = а 5 {а = $((3y) . ye 5. xRy)} Df.
Поэтому,
L . Re 5 = $ {($y) . ye(5. xRy}.
Так, если R есть отношение отца к сыну, а 5 - это класс выпускников Итона, то R
e ‘ 5 будет классом ‘отцы выпускников Итона’; если R есть отношение ‘меньше’, а 5 - это класс правильных дробей формы 1-2
-и для целых значений п, то R
e‘5 будет классом дробей, меньших чем некоторая дробь формы 1-2
-п; т.е. R
e‘5 будет классом правильных дробей.
Другое вышеупомянутое отношение есть (R )
e.
В качестве альтернативной записи, часто более удобной, мы устанавливаем:
R‘ ‘ 5 = R
e ‘ 5 Df.
Относительное произведение двух отношений R и S есть отношение, которое имеет место между х и z всегда, когда имеется элемент у, такой что и xRy, и yRz имеют место. Относительное произведение обозначается как R | S. Так,
R IS = $ $ {($y) . xRy. yRz} Df.
Мы также устанавливаем:
R
2 = R | R Df.
Часто требуются произведение и сумма класса классов. Они определяются следующим образом:
sk = $ {(За) . aek. xea} Df. pk = $ {аек. з
а. xea} Df.
Сходным образом для отношений мы устанавливаем:
^ ‘Я = У У {($R). Re Я. xRy} Df. p ‘Я = $
у {ReЯ. ^>
R . xRy} Df.
Нам нужна запись для классов, чьим единственным элементом является х. Пеано использует ix, поэтому, мы будем использовать ix. Пеано показал (это подчёркивал и Фреге), что этот класс нельзя отождествить с х. При обычном взгляде на классы необходимость такого различия остаётся загадочной; но с точки зрения, выдвинутой выше, она становится очевидной.
Мы устанавливаем:
i = {a = $ (y = x)} Df.,
отсюда,
L . ix = у(y = x) Df., и
L : E! i ‘a. ^ . i ‘a = (Ox)(xea);
т.е. если a - это класс, который имеет только один элемент, то этим элементом является
U ‘a
7.
Для класса классов, содержащихся в данном классе, мы устанавливаем:
Cl‘a = b(b a) Df.
Теперь мы можем перейти к рассмотрению кардинальных и ординальных чисел и того, как их затрагивает учение о типах.
IX. КАРДИНАЛЬНЫЕ ЧИСЛА
Кардинальное число класса a определяется как класс всех классов, сходных с a; два класса являются сходными, когда между ними имеется одно-однозначное отношение. Класс одно-однозначных отношений обозначается как | ® | и определяется следующим образом:
1 ® 1 = R {xRy . xRy. xRy . 3
x,
y,
x/,y . x = x . y = y} Df.
Сходство обозначается как Sim и определяется так:
Sim = ab {($R) . Re 1® 1 . D‘R = a. D‘R = b} Df.
Тогда, Sim ‘a есть, по определению, кардинальное число a; его мы будем обозначать как Nc
ia; следовательно, мы устанавливаем:
и
Таким образом, l ‘a есть то, что Пеано называет ia.
——
отсюда,
L. Nc‘ a = Sim ‘ a.
Класс кардинальных чисел мы будем обозначать как NC; таким образом,
О определяется как класс, чьим единственным элементом является нуль-класс (т.е. Л), поэтому
Определение 1 следующее:
1 = а{(3^ : xea. °
x. x = c} Df.
Легко доказать, что, согласно определению, О и 1 являются кардинальными числами.
Однако необходимо отметить, что, согласно приведённым выше определениям, О, 1 и все другие кардинальные числа являются неопределёнными символами, типа cls, и имеют столь много значений, сколько существует типов. Начнём с О; значение О зависит от значения Л, а значение Л различается согласно типу, нуль-классом которого он является. Таким образом, существует столько же О, сколько существует типов; то же самое применяется ко всем другим кардинальным числам. Тем не менее, если два класса а и fb относятся к различным типам, мы можем говорить о них, как об имеющих одно и то же кардинальное число, или что один из них имеет кардинальное число большее, чем другой, поскольку одно-однозначное отношение может иметь место между элементами а и fb даже тогда, когда а и fb относятся к различным типам. Например, пусть fb будет і‘‘ а, т.е. классом, чьими элементами являются классы, состоящие из единственного члена a. Тогда іа относится к более высокому типу, чем а, но подобно а, поскольку соотнесено с а посредством одно-однозначного отношения і.
Иерархия типов имеет важные следствия в отношении сложения. Предположим, у нас есть класс из а членов и класс из b членов, где а и b являются кардинальными числами; может случиться так, что их совершенно невозможно объеденить, чтобы получать класс, состоящий из членов а и из членов fb, поскольку, если классы не относятся к одному и тому же типу, их логическая сумма бессмысленна. Только там, где рассматриваемое число классов конечно, мы можем устранить практические следствия этого благодаря тому факту, что мы всегда можем применить к классу, который увеличивает свой тип до любой требуемой степени без изменения своего кардинального числа. Например, при любом классе а класс і‘‘а имеет то же самое кардинальное число, но относится к типу идущему за а. Следовательно, для любого конечного числа классов различных типов мы можем увеличить все их до типа, который мы можем назвать наименьшим общим множителем всех рассматриваемых типов; и можно показать, что это может быть сделано таким способом, что результирующие классы не будут иметь общих элементов. Затем мы можем образовать логическую сумму всех полученных таким образом классов, и её кардинальное число будет арифметической суммой кардинальных чисел изначальных классов. Но там, где у нас есть бесконечные последовательности классов восходящих типов, этот метод применить нельзя. По этой причине мы не можем доказать, что должны быть бесконечные классы. Ибо, предположим, что было бы вообще только n индивидов, где n - конечно. Тогда было бы 2
n классов индивидов, 2
” классов классов индивидов и т.д. Таким образом, кардинальное число членов каждого типа было бы конечно; и хотя эти числа превосходили бы любое заданное конечное число, не было бы способа сложить их так, чтобы получить бесконечное число. Следовательно, нам необходима (и по всей видимости, так оно и есть) аксиома в том смысле, что ни один конечный класс индивидов не содержит все индивиды; однако, если кто-то отдаст предпочтение тому, что общее число индивидов в универсуме равно, скажем, 10367, то, по-видимому, нет априорного способа опровергнуть его мнение.
На основании предложенного выше способа рассуждения ясно, что доктрина типов избегает всех затруднений относительно наибольшего кардинального числа. Наибольшее кардинальное число есть в каждом типе; но его всегда превосходит кардинальное число следующего типа, поскольку, если а - кардинальное число одного типа, то кардинальное число следующего типа есть 2
а, которое, как показал Кантор, всегда больше, чем а. Поскольку не существует метода сложения различных типов, мы не можем говорить о ‘кардинальном числе всех объектов каких бы то ни было типов’ и, поэтому, абсолютно наибольшего кардинального числа не существует.
Если принимается, что ни один конечный класс индивидов не содержит всех индивидов, отсюда следует, что существуют классы индивидов, имеющие любое конечное число. Следовательно, все конечные кардинальные числа имеют место как кардинальные числа индивидов; т.е. как кардинальные числа классов индивидов. Отсюда следует, что существует класс No кардинальных чисел, а именно, класс конечных кардинальных чисел. Следовательно, N° имеет место как кардинальное число класса классов классов индивидов. Образуя все классы конечных кардинальных чисел мы находим, что 2*° имеет место как кардинальное число класса классов классов классов индивидов; и так мы можем продолжать неопределённо долго. Можно также доказать существование N
n для каждого конечного n; но это требует рассмотрения ординалов.
Если в добавок к предположению, что ни один из конечных классов не содержит всех индивидов, мы предполагаем мультипликативную аксиому (т.е. аксиому, что для заданного множества взаимно исключающих классов, ни один из которых не является нулевым, есть по крайней мере один класс, включающий один элемент из каждого класса этого множества), то мы можем доказать, что существует класс, содержащий N° элементов, так что N° будет иметь место как кардинальное число индивидов. Это несколько уменьшает тип, до которого мы должны дойти, чтобы доказать теорему о существовании для любого заданного кардинального числа, но не даёт нам какой-либо теоремы о существовании , которая раньше или позже не может быть получена иначе.
Многие элементарные теоремы, включающие кардинальные числа требуют мультипликативную аксиому
. Необходимо отметить, что эта аксиома эквивалентна аксиоме Цермело
и, следовательно, допущению, что каждый класс может быть вполне упорядочен
. Эти эквивалентные предпосылки, по-видимому, доказать невозможно, несмотря на то, что мультипликативная аксиома выглядит достаточно правдоподобной. В отсутствии доказательства, видимо, лучше не принимать мультипликативную аксиому как допущение, но устанавливать её как условие в каждом случае, в котором она используется.
X. ОРДИНАЛЬНЫЕ ЧИСЛА
Ординальное число есть класс ординально сходных вполне упорядоченных рядов, т.е. отношений, образующих такие ряды. Ординальное сходство, или подобие, определяется следующим образом:
Smor = P Q {(3S). Se1®1 . [D]‘S = OQ . P = s\q\S } Df.,
где ‘Smor’ есть сокращение для ‘сходны ординально’.
Класс отношений ряда, которые мы будем называть ‘Ser’, определяется так:
Ser = P {xPy. >
y . ~ (x = y) : xPy . yPz .
y,
z . xPz : xe OP . >>
x . P ‘x u ix u P ‘x =
C‘P}Df.
Т.е. если читать P как ‘предшествует’, то отношение является отношением ряда, если: (1) нет ни одного элемента, предшествующего самому себе; (2) предшественник предшественника есть предшественник; (3) если х есть какой-то член поля отношения, то предшественники х вместе с х в совокупности с его предшественниками образуют всё поле отношения.
Вполне упорядоченные отношения ряда, которые мы будем называть W, определяются следующим образом:
W = P {Pe Ser : a <z OP. $!a. >
a. $!(a - P ‘‘a)} Df.;
т.е. P порождает вполне упорядоченные ряды, если P есть отношение ряда, и любой класс а, содержащийся в поле P и не являющийся нулевым, имеет первый член. (Отметим, что P ‘‘a суть члены, входящие после некоторого члена a).
Если как No^P обозначить ординальное число вполне упорядоченного отношения P, а как NO класс ординальных чисел, то мы получим:
No = a P {PeW . а = Smor ‘P} Df.,
NO = No‘‘W.
Из определения No мы получат:
L : Pe W . з . No
iP = Smor ‘P ,
L : ~(Pe W) . 3 . ~E!No‘P.
Если теперь мы проверим наши определения с точки зрения их связи с теорией типов, мы увидим, прежде всего, что определения ‘Ser’ и W включают поля отношений ряда. Поле же значимо только тогда, когда отношение является однородным; следовательно, отношения, которые не являются однородными, не порождают ряд. Например, можно подумать, что отношение і порождает ряд ординального числа w, типа
x, i X, 1111 x, ... і
п‘x, ...,
и этим способом мы можем попытаться доказать существование w и No- Но х и ix относятся к различным типам и, следовательно, согласно нашему определению, такого ряда нет. Ординальное число ряда индивидов, согласно приведённому выше определению No, есть класс отношений индивидов. Следовательно, он по типу отличается от любого индивида, и не может образовывать часть какого-то ряда, в котором встречаются индивиды. Опять же, предположим, что все конечные ординалы имеют место как ординальные числа индивидов; т.е. как ординалы рядов индивидов. Тогда, конечные ординалы сами образуют ряд, чьё ординальное число есть w; таким образом, w существует как ординальное число ординалов, т.е. как ординал ряда ординалов. Но тип ординального числа ординалов - это тип классов отношений классов отношений индивидов. Таким образом, существование w доказывалось в рамках более высокого типа, чем тип конечных ординалов. Опять таки, кардинальное число ординальных чисел вполне упорядоченного ряда, который может быть создан из конечных ординалов, есть Ni; следовательно, N имеет место в типе классов классов классов отношений классов отношений индивидов. К тому же, ординальные числа вполне упорядоченных рядов, составленных из конечных ординалов, могут быть упорядочены в порядке величины, и результатом будет вполне упорядоченный ряд, чьё ординальное число есть щ. Следовательно, щ имеет место как ординальное число ординалов ординалов. Этот процесс можно повторить любое конечное число раз и, таким образом, мы можем в соответствующих типах установить существование N
n и w
n для любого конечного значения п.
Но вышеуказанный процесс порождения более не ведёт к какой-то целостности всех ординалов, поскольку, если мы возьмём все ординалы какого-то заданного типа, всегда существуют более высокие ординалы в более высоких типах; и мы не можем объединить множество ординалов, тип которого превышает любую конечную границу. Таким образом, ординалы в каком-то типе могут быть упорядочены в порядке величины во вполне упорядоченный ряд, который имеет ординальное число более высокого типа, чем тип ординалов, составляющих ряд. В новом типе этот новый ординал не является наибольшим. Фактически, не существует наибольшего ординала в каком-то типе, но в каждом типе все ординалы меньше, чем некоторый ординал более высокого типа. Невозможно завершить ряд ординалов, поскольку это приводило бы к типам, превышающим каждую приписываемую конечную границу; таким образом, хотя каждый сегмент ряда ординалов вполне упорядочен, мы не можем сказать, что вполне упорядочен весь ряд, поскольку ‘весь ряд’ является фикцией. Следовательно, парадокс Бурали-Форти исчезает.
Из двух последних разделов обнаруживается, что если принять, что число индивидов не является конечным, то можно доказать существование всех канторовских кардинальных и ординальных чисел, за исключением K
w и (Хотя вполне возможно, чтобы их существование было доказуемым.) Существование всех конечных кардинальных и ординальных чисел можно доказать без предпосылки о существовании чего бы то ни было. Ибо, если кардинальное число членов в каком-то типе есть п, число членов в следующем типе есть 2
п. Таким образом, если бы индивидов не существовало, то был бы один класс (а именно, нуль-класс), два класса классов (а именно, тот, что не содержит классов, и тот, что содержит нуль-класс), четыре класса классов классов, и в общем 2
п-1 классов n-го порядка. Но мы не можем объединить члены различных типов и, поэтому, не можем этим способом доказать существование какого-то бесконечного класса.
Теперь мы можем подвести итог всему рассмотрению. После установления некоторых парадоксов логики, мы нашли, что все они вырастают из того факта, что выражение, указывающее на всё из некоторой совокупности, по-видимому, обозначает само себя как одно из этой совокупности; как, например, ‘все пропозиции являются либо истинными, либо ложными’ само, по видимости, является пропозицией. Мы решили, что там, где это, судя по всему, встречается, мы имеем дело с ложной целостностью, и что, фактически, ничего вообще нельзя значимо сказать обо всём из предполагаемой совокупности. Чтобы дать ход этому решению, мы объяснили доктрину типов переменных, придерживающуюся принципа, что любое выражение, которое указывает на всё из некоторого типа, должно, если оно что-либо обозначает, обозначать нечто более высокого типа, чем всё то, на что оно указывает. Там, где указывается на всё из некоторого типа, есть мнимая переменная, принадлежащая этому типу. Таким образом, любое выражение, содержащее мнимую переменную, относится к более выісокому типу, чем эта переменная. Это -фундаментальный принцип доктрины типов. Изменение в способе, которым конструируются типы, (это следует доказать с необходимостью) оставило бы решение противоречий незатронутым до тех пор, пока соблюдается этот фундаментальный принцип. Метод конструирования типов, объяснённый выше, продемонстрировал нам, как возможно установить все фундаментальные определения математики и в то же время избежать всех известных противоречий. И оказалось, что на практике доктрина типов уместна лишь там, где затрагиваются теоремы о существовании, или там, где необходимо перейти к некоторому частному случаю.
Теория типов ставит ряд трудных философских вопросов, касающихся её интерпретации. Однако эти вопросы в сущности отделимы от математического развития этой теории и, подобно всем философским вопросам, вводят элемент неопределённости, который не относятся к самой теории. Следовательно, по-видимому, лучше формулировать эту теорию без ссылки на философские вопросы, оставляя их для независимого исследования.
Нейросети: Нейролингвистика - Логика