Nov 5, 2022

Proof by Contradiction

「$x^2$が偶数ならば$x$は偶数である」とか「兵庫県民は神戸市民である」など,正しい(真)か 正しいとは限らない(偽)かがはっきり判断できることを述べたものを proposition(命題)といい,それを証明するのに direct proof(直接証明)が難しい場合は indirect proof(間接証明)を使います.その代表的なものに,対偶による証明背理法があります.

Hypothetical proposition(仮言命題)「PならばQである」の contrapositive(対偶)「QでないならPでない」を示すこと,すなわち対偶による証明は proof by contrapositive といいます.元の命題とその対偶の真偽が一致するのでこの方法が使えるわけですが,その理由は高校数学の教科書に必ず載っていますので見てみてください. 

一方,categorical proposition(定言命題)「AはQである」の結論を否定すると矛盾が起こることを示す背理法は proof by contradiction といいます.この contradiction は矛盾という意味なので,背理法は直訳すると 「矛盾による証明」 ということになります.背理とは 「道理に背く」ことなので,矛盾と同じような意味になりますが,よくある日本語の証明の中では「道理に背く」とはいわずに「矛盾する」という言い方をするので,これは「矛盾による証明」と訳した方が良かったのではないかと思います.

同様に訳し方がおかしいと思うものに,rational number(有理数),irrational number(無理数)があります.rational は合理的,irrational は非合理的という意味なので,「じゃあ無理数は非合理的なんかい!」と文句をいいたくなります.もともと ratio が比という意味なので,整数の比で表せる「有比数」または「可比数」と,そうでない「無比数」または「不可比数」にした方が良かったと思います.

さて, 背理法といえば,①「$\sqrt{2}$は無理数である」ことの証明が有名で,どの高校数学の教科書にも載っています.他にも ②「素数は無限に存在する」や ③「円の接線は接点を通る半径に垂直である」という命題が有名です.

②は日本の中高の教科書には登場しません.Euclid's Elements(ユークリッドの原論)Book Ⅸ の Proposition 20 に少しわかりにくい証明が載っていますが,もっと分かり易い証明がネット上で簡単に見つかりますので探してみてください.

③は事実のみが中1の教科書から登場するのに,中高教科書のどこにもその証明がありません.あまりにも当たり前なことのように見えるからだと思われます.この証明もユークリッドの原論にありますので,詳しく見てみましょう.

Proposition 18 (Book Ⅲ) 

"If a straight line touches a circle, and a straight line is joined from the center to the point of contact, the straight line so joined will be perpendicular to the tangent."

Euclid's Elements
続いて証明があります.分かり易く意訳してみます.

円ABCの中心をFとし,点Cにおける接線を直線DEとします. 

DE⊥FCでないと仮定,すなわち結論を否定します.

すると,Cとは別にDE⊥FGとなる点Gが接線DE上にあるはずです.

その点Gが存在するなら,∠FGCの方が直角になり,∠FCGは鋭角になります.すると直角三角形FGCの斜辺はFCとなり,これは他の辺より長いはずなので

FG<FC

となるはずです(この図ではそのように見えませんが,DE⊥FGと仮定すればこうなります).

しかし,実際はFG>FB=FC, すなわち

FG>FC

なので矛盾します.

DE⊥FCでないと仮定したことで矛盾が起こりました.

ゆえにDE⊥FCが成り立つ,すなわち円の接線は接点を通る半径に垂直であるということが,背理法によって証明されました.

[Question] (The answer follows after reference)

Prove there are no integers a and b such that 10a + 15b = 1.

(by StudySmarter)

[Reference]

Euclid's Elements   Book III   Proposition 18
http://aleph0.clarku.edu/~djoyce/elements/bookIII/propIII18.html

StudySmarter "Proof by Contradiction"
https://www.studysmarter.us/explanations/math/pure-maths/proof-by-contradiction/

[Answer] (Drag bellow) 

Let us assume that we could find integers a and b that satisfy such an equation. We can then divide both sides by 5 to give 2a + 3b = 1/5. If a and b are integers, and we multiply each by another integer (2 and 3 respectively, in this case), then sum them, there is no possible way that this could result in being a fraction, which is what the above condition requires. This leads us to a contradiction. Thus, there are no integers a and b such that 10a + 15b = 1.

Oct 15, 2022

Inverse

Inverse は主に「逆」という意味で,次のような場合に使われています.

・inverse operation(逆演算):例えば $+$ に対して $-$, $\times$ に対して $\div$.

・inverse function(逆関数):例えば $y=2x$ に対して $y=\frac{1}{2}x$,$y=e^x$ に対して $y=\log_{e}x$.

・inverse element(逆元):例えば opposite(反数)は $a$ に対する $-a$ で additive inverse(加法逆元)といい,また reciprocal(逆数)は $a$ に対する $\frac{1}{a}$ または$a^{−1}$で multiplicative inverse(乗法逆元)といいます.

ここまでは意外でもなんでもないのですが,日本の高等学校必履修「数学Ⅰ」 の proposition(命題)に関する用語「逆,裏,対偶」を意味する英語は次のようにになっています.

・ conditional statement(条件文):P implies Q(PならばQ)P$ \implies $Q

に対して,次の3つが定義されています.

・converse statement(逆) : Q implies P(QならばP)Q$\implies$P

・inverse statement(裏) : ~P implies ~Q(PでないならQではない)~P$\implies$~Q

・contrapositive statement(対偶) : ~Q implies ~P(QでないならPではない)~Q$\implies$~P

ここでは,仮定と結論を入れ替えたものが converse(逆),仮定と結論をそのまま否定したものが inverse(裏)となっていて,inverse が「逆」ではないので少し混乱してしまいますね.英和辞典(英ナビ!辞書)を調べてみると,converse には「逆,反対」の意味がありますが,inverse には「逆,反対」に加えて「裏表,裏腹」という意味もありました.誤訳や間違いというわけではなさそうです.

[Question] (The answer follows after reference)

What is the inverse statement of the following conditional statement?
"If $x=1$, then $x^2=1$."

(a) If $x\neq1$, then $x^2=1$.
(b) If $x\neq1$, then $x^2\neq1$.
(c) If $x^2=1$, then $x=1$.
(d) If $x^2\neq1$, then $x\neq1$.

 

[Reference]

Converse, Inverse, and Contrapositive of a Conditional Statement
https://www.chilimath.com/lessons/introduction-to-number-theory/converse-inverse-and-contrapositive-of-conditional-statement/

Converse, Inverse, and Contrapositive
https://www.mometrix.com/academy/converse-inverse-and-contrapositive/

[Answer] (Drag bellow) 
An inverse statement assumes the opposite of each of the original statements. The opposite of “If x=1” would be “If x≠1.” The opposite of “then x2=1” would be “then x2≠1.”  Then answer is (b).

Sep 30, 2022

LCD

visualpharm.com
LCDといえば,テレビやパソコンでお馴染みの Liquid Crystal Display(液晶ディスプレイ)を思い浮かべます.また似ている用語では,照明に使われるLEDですが,これは Light Emitting Diode(発光ダイオード)の略になります.「いまさら聞けない」豆知識という感じですね.

数学関連で似ているものは,LCM = Least Common Multiple(最小公倍数),GCD = Greatest Common Deviser(最大公約数),GDC = Graphing Display Calculator(グラフ電卓)などがあります.ややこしいですね.

注)最大公約数は,他にもGCM (Greatest Common Measure) またはGCF (Greatest Common Factor) または HCF (Highest Common Factor) と言う場合があります.

さて,LCDは数学用語ではどういう意味なのでしょうか.これは,Least Common Denominator または Lowest Common Denominator といって,日本語では「最小公分母」といい,複数の分数の分母の最小公倍数を意味します.例えば,2と3の最小公倍数は6なので,「$\frac{1}{2}$と$\frac{1}{3}$のLCDは6である」という言い方をします.日本ではこの用語はほとんど聞いたことがないのですが,英語の解説にはよく登場します.

因みに,「通分する」ことを英語では次のようにいいます.

        reduce (the fractions) to a common denominator

例えばこんな言い方があります.

        Add 1/2 to 1/3 by reducing the fractions to a common denominator
        LCD(1/2, 1/3)=LCM(2, 3)=2×3=6 so that 1/2+1/3=3/6+2/6=5/6

"reduce" はもともと「減らす」という意味なので,「通分がなぜ reduce?」と思ってしまいますが,通分は「複数の分数を共通の分母でひとつにまとめる」すなわち「複数の分数を共通の分母でひとつに減らす」という意味もあるので,この用語が使われているのだと思われます.

ところで,通分には次のような言い方もあります.どの表現を使われても意味が分かるようにしておきたいですね.

        put ~ over a common denominator
        change ~ to equivalent fractions with a common denominator

実は「約分する」というのも"reduce"を使います.こちらは約分すれば分母・分子の値が減少するので,この用語で違和感はありません.通分にも約分にも同じ"reduce"を使うことになるわけですが,後に続く文が少し違います.

        reduce (a fraction) to its lowest terms(既約分数まで約分する)

この用語のおかげで,reducible(可約),irreducible(既約)といった言い方も覚えやすくなります.ただ,約分にも simplify, cancel という別の言い方もあるので,やはりどの表現を使われても意味が分かるようにしておきたいですね.

覚えておきたい関連した用語は他に次のものがあります.

        like fraction(分母の等しい分数) (c.f.) like term(同類項)
        bottom number / denominator(分母)
        top number / numerator(分子)

[Question] (The answer follows after reference)

What is the LCD for the following three fractions?
1/18, 1/24 and 1/30

[Reference]

Least Common Denominator - LCD
https://www.cuemath.com/numbers/least-common-denominator-lcd/

[Answer] (Drag below)

360

Jul 18, 2022

Sextic

Sex は「性」や「性別」などの意味があるので,sexual, sexy は「性的な」という意味になります.それなら sextic も同様の意味ではないかと思ってしまいますが,これは全く異なる意味の数学用語で, 形容詞なら「6次の」,名詞なら「6次式」という意味になります.6 なら six だろうと思いますが,数学用語は Latin(ラテン語)や Greek(ギリシャ語)が語源になっているものが多く,これも Latin で 6 を表す sex を語源としています.なので,例えば sextic function なら6次関数という意味になります.

両言語の数詞をまとめてみました.


数学用語以外にも,monotone, duet, triathlon など,これらが頭につくものがたくさんありますね.

[Quiz] 1960年代に「ドリフターズ」から分裂して活躍した4人組コミックバンド(のちに5人になった)のグループ名は「○○○○カルテット」.○○○○は何?

[Answer] (次の行をドラッグしてください)
Donkey Quartet(ドンキーカルテット)

紀元前,1年が10か月だった時代,今の August(8月)は Sextilis(6番目の月)と呼ばれていました.その後 January, February が加わって12か月になっても名称は変わりませんでしたが,後にローマ皇帝 Augustus が自分の名を使って August に変えました.因みに,7月も Quintilis(5番目の月)だったのを,あの Julius Caesar が 同じく自分の名をとって July に変えました.しかし,September から December は当初の意味から2か月ずれたまま残っています.

意外なところでは,16進法を hexadecimal または sexadecimal と言うのに対し,60進法は sexagecimal と言いますが,hexagecimal とは言わないようです.

次数の表現です.


1変数の sextic equation(6次方程式)は一般に次式で表されます.$$a_6x^6+a_5 x^5+a_4x^4+a_3x^3+a_2x^2+a_1x+a_0=0$$Abel–Ruffini theorem(アーベル–ルフィニの定理)により,5次以上の方程式は代数的に(四則演算と累乗根で)解けないのですが,Galois theory(ガロア理論)から,ある条件を満たすときは代数的に解けることが分かっています.例えば次のような特別な形なら$x^3$を変数とする2次方程式として代数的に解くことができます.$$a_6x^6+a_3x^3+a_0=0$$必ず解ける代数的でない(超越的な)解法はあるのですが,あまりにも複雑なので,実用的には数値計算で解を求めるのが一般的です.

Cayley's sextic

次の2変数 sextic equation(6次方程式)を Cayley's sextic といいます.これは他の人が最初に発見したのですが,Cayley が詳しく研究したのでこの名前がついています.$$64 (x^2+y^2)^3-48 ax (x^2+y^2)^2-3 a^2(x^2+y^2)(5 x^2+9 y^2) -a^3 x^3=0$$
a=-1のとき                                     a=1のとき

これはよく知られた Cardioid(心臓形)上の任意の点における接線に原点から降ろした垂線の足の軌跡(pedal curve=垂足線)になっています.
内側の曲線がCardioid (Wolfram MathWorld)

[Reference]



Jul 5, 2022

Nature of Roots

この nature を「自然」と訳すと,nature of roots は「根っこの自然」となって,これは植物学的な話かなと思ってしまいます.数学ではどんな場面に登場しているのか見てみましょう.

Use the discriminant to determine the nature of the roots of quadratic equation. 

これなら「2次方程式の根(こん)の自然を決めるには判別式を使う」となりますが, nature には次の意味もあります.

Weblio英和対訳辞書 "nature"
自然、天然、自然界、自然力、自然現象、(人・動物の)本性、天性、性質、本質、特質

なので「2次方程式の根(こん)の性質を調べるには判別式を使う」ということになります.しかし discriminant(判別式)で判別するのは,2次方程式の解が「two distinct real roots(異なる2つの実数解),multiple roots(重解),imaginary roots(虚数解)」(複素数を未習の場合は「虚数解」ではなく「解なし」)のどれになるかということですから,「性質」というのも少し違う気がします.

続いて "nature of" の意味を調べてみると,

Weblio英和対訳辞書 "nature of"
[単数形で; 通例修飾語を伴って] 種類, [the nature] 〔ものの〕本質,特質,特徴 

というわけで,nature of roots は「根(解)の種類」と訳すのが正しいようです.したがって,上の文章は「2次方程式の根(解)の種類を決めるには判別式を使う」という意味になります.日本の高校数学Ⅱの教科書でも,「解の種類を判別する」という言い方が使われています.

ところでもともと判別式は,n次方程式が重解を持つ条件を与える式として,19世紀中ごろに英国の数学者 Sylvester が導入しました.$n$次方程式 $$a_nx^n+a_{n-1}x^{n-1}+\cdot\cdot\cdot+a_1x+a_0=0 \quad (a_n \neq 0)$$ の重複を含めた解を $\alpha_1, \cdot\cdot\cdot, \alpha_n$ とすると,$$\prod_{i<j}(\alpha_i-\alpha_j)=0$$になるとき,すなわちすべての異なる(はずの)解の差の積が0になるとき,どれか2つ以上の解が一致するので重解を持ちます.Sylvester はさらに虚数の平方は負になることから虚数解を判別するためにこの式を平方し,式の値を分数にしないようにするために$a_n^{2n-2}$を掛けて,判別式$D$を次の式で与えました.$$D=a_n^{2n-2}\prod_{i<j}(\alpha_i-\alpha_j)^2$$例えば$n=3$なら,$D=a_3^{2・3-2}(\alpha_1-\alpha_2)^2(\alpha_2-\alpha_3)^2(\alpha_1-\alpha_3)^2$となり,これが3次方程式の判別式になりますが,これだけでも計算はかなり複雑です.

では$n=2$にしてみましょう.$$D=a_2^{2・2-2}(\alpha_1-\alpha_2)^2$$ここで2次方程式を $ax^2+bx+c=0$,その重複を含めた解を$\alpha$,$\beta$とすると,解と係数の関係より,$\alpha+\beta=-\frac{b}{a},\quad\alpha\beta=\frac{c}{a}$なので,\begin{eqnarray} D &=& a^2(\alpha-\beta)^2 \\&=&  a^2(\alpha^2-2\alpha\beta+\beta^2) \\&=& a^2\left( (\alpha+\beta)^2-4\alpha\beta \right)  \\ &=& a^2\left( \left(-\frac{b}{a}\right)^2-4\left( \frac{c}{a}\right)  \right)  \\&=& b^2-4ac \end{eqnarray}というわけで,お馴染みの2次方程式の判別式を導くことができました.

[Question] (The answer follows after reference)

Find the value of the discriminant, and state the nature of the roots for each equation. (Mathematics SL : Oxford University Press)

a) $x^2+5x-3=0$
b) $2x^2+4x+1=0$
c) $4x^2-x+5=0$
d) $x^2+8x+16=0$

[Reference]

Weblio英和対訳辞書

Discriminant
https://en.wikipedia.org/wiki/Discriminant

代数方程式の判別式
http://hooktail.sub.jp/algebra/Discriminant/

[Answer] (Drag below)

a)     37 ; two  different real roots
b)     8 ; two different real roots
c)     -79 ; no real roots
d)     0 ; two equal real roots

Jun 14, 2022

Vertex Form

Polygon(多角形)や polyhedron(多面体)などの図形では,2本以上の辺が集まっている点のことを vertex(頂点)といいます.多面体の頂点 (V),辺 (E=edge),面 (F=face) の数に関する Euler's polyhedron theorem (オイラーの多面体定理)$V-E+F=2$ は有名ですよね.

Quadratic function(二次関数)のグラフの形は parabola(放物線)といいますが,その向きが変わる点のことを頂点といい,英語では vertex または turning point といいます.そしてその頂点の座標$(p,q)$がすぐにわかるように表した式$$y=a(x-p)^2+q\tag{1}$$を vertex form といいます.直訳すると頂点形ということになりそうですが,日本語ではこう呼ばれず,基本形と呼ばれています.ところが,これを英語に直訳して basic form というと, $y=ax^2$ を意味することになります.なので式(1)は,英語では vertex form,日本語でも基本形ではなく頂点形と呼ぶ方がよさそうです.

一方,次のように展開された式(2)は general form(一般形)と呼ばれています.$$y=ax^2+bx+c\tag{2}$$この式(2)を式(1)に変形することを,completing square(平方完成)といいます.

さらにもうひとつ,次の式(3)で2次関数を表す方法があります.$$y=a(x-\alpha )(x- \beta)\tag{3}$$これは factorize(因数分解)された形なので factored form(因数分解形 or 分解形),または$x$ intercept($x$切片)$\alpha$,$\beta$がすぐに分かる形なので intercept form(切片形)とも呼ばれています.

上の式(1)と(2)は Standard Form(標準形)と呼ばれることもあり,話が少しややこしくなります.

■式(1)を Standard Form(標準形)と呼んでいる例
(英) https://mathsgee.com/9601/what-is-the-standard-form-of-a-quadratic-function
(日) http://wakarimath.net/explanation/q.php?pID=E00008
■式(2)を Standard Form(標準形)と呼んでいる例
(英) https://www.turito.com/learn/math/quadratic-functions-in-standard-form
(日) https://kaz-academy.com/math-koshiki22/

基本,標準,一般という用語の定義が曖昧であることが原因です.このような〇〇形といういい方は,日本の教科書では使われていないのですが,実際,日英の多くの参考書やサイトでは当たり前のように使われています.

ついでに,他にも 〇〇form といういい方があるので日英で調べてみました.

■Linear Function(一次関数)/ Equation of a Line(直線の方程式)
slope-intercept form $y=mx+k$ 基本形ともいう
standard form(標準形) $ax+by=c$
general form(一般形)        $ax+by+c=0$
intercept form(切片形) $\displaystyle \frac{x}{a}+\frac{y}{b}=1$
point-slope form  $y-y_1=m(x-x_1)$
two-point form  $y-y_1=\frac{y_2-y_1}{x_2-x_1}(x-x_1) $
vector form  $\vec{p}=\vec{a}+t\vec{d}$  or  $\boldsymbol{p}=\boldsymbol{a}+t\boldsymbol{d}$

■Equation of a Circle (円の方程式)
center-radius form $(x-p)^2+(y-q)^2 = r^2$ 標準形または基本形ともいう
general form(一般形) $x^2 + y^2 +lx + my + n = 0$

以上のことから,グラフの特性である頂点や傾き切片や中心半径などがすぐに分かる式の形はその名前を使って頂点形,傾き切片形,中心半径形などと呼び,それを展開した形は一般形と呼ぶのが良いのではないでしょうか.何でも英語に合わせるが良いというのではなく,なるべく意味の曖昧な言葉を使わない方が良いと思います.

Apr 29, 2022

Aliquot

「約数」という日本語は,他にも「因数」や「因子」などの言い方がありますが,英語でも divisor, measure, factor, submultiple, aliquot などいろいろな言い方があります.最初の3つは,GCD (Greatest Common Divisor), GCM (Greatest Common Measure), HCF (Highest Common Factor) と表すと,いずれも「最大公約数」を意味します.あまり使われませんが,greatest common submultiple という場合もあります.しかし,aliquot だけは少し違った意味があります.

数学英和・和英辞典(共立出版)には,

aliquot a. 割り切れる,整除できる. n. 割り切れる数,約数. ~ part 約数.

と書かれているので,これだけでは aliquot も同じ「約数」という意味ではないかと思いますが,実は多くの場合,aliquot または aliquot part というのは proper divisor(真約数),すなわちそれ自身を含まない約数を意味します.例えば12の divisors は 1, 2, 3, 4, 6, 12ですが,12の aliquot は 1, 2, 3, 4, 6になります.

関連するものに aliquot sum(アリコット和), aliquot sequence(アリコット数列)があります.aliquotだけ和訳がないのは不思議ですが,元々Latin語の ali (otherの意) とquot (how manyの意)から来ているそうです.

aliquot sequence(アリコット数列)

正の整数$k$の全約数の総和を$\sigma(k)$と表します.aliquot sum すなわち proper divisor の総和は,全約数の総和からそれ自身を引くので,$\sigma(k)-k$となります.$k$に対して,aliquot sum を返す関数$s(k)=\sigma(k)-k$を "restricted divisor function"といいます.正式な日本語訳はありませんが,強いていうなら意訳して「真約数関数」でしょうか.

aliquot sequence は,正の整数$k$から始まり,次の項がその前の項の restricted divisor function の値,すなわち aliquot sum になるという,次の漸化式を満たす数列です.$$s_0=k,\quad \quad s_{n+1}=s(s_n)=\sigma(s_n)-s_n$$例1. $k=4$のとき,\begin{eqnarray}s_0&=&4\\s_1&=&s(s_0)=\sigma(s_0)-s_0=\sigma(4)-4=(1+2+4)-4=1+2=3\\ s_2&=&s(s_1)=\sigma(s_1)-s_1=\sigma(3)-3=(1+3)-3=1\\ s_3&=&s(s_2)=\sigma(s_2)-s_2=\sigma(3)-3=1-1=0\end{eqnarray}
例2. $k=6$のとき,\begin{eqnarray}s_0&=&6\\s_1&=&(1+2+3+6)-6=1+2+3=6\\ s_2&=&(1+2+3+6)-6=1+2+3=6\end{eqnarray}
例3. $k=220$のとき,
\begin{eqnarray}s_0&=&220\\s_1&=&1+2+4+5+10+11+20+22+44+55+110=284\\ s_2&=&1+2+4+71+142=220\end{eqnarray}
例1は最後が「素数→1→0」となって終ります.例2は aliquot sum がそれ自身に一致する complete number(完全数)なので,同じ数が繰り返されます.例3はお互いが相手の aliquot sum になる a pair of amicable numbers(友愛数)なので,2数が交互に現れます.他にも3つ以上の数を繰り返す sociable numbers(社交数)があります.以上で aliquot sequence のパターンがすべて尽くされているとする Catalan-Dickson conjecture(カタラン-ディクソン予想)は,2022年4月現在,未解決問題となっています.

[Reference]

Aliquot sequences
https://www.unirioja.es/cu/jvarona/aliquot.html

aliquot part
https://www.daviddarling.info/encyclopedia/A/aliquot_part.html

Mar 13, 2022

Bin

缶は英語でも can といいますが,瓶は bin ではなく bottle といいます.bin には蓋つきの容器やごみ箱という意味があるので「物を入れる」という点では瓶と似ています.さらにこの bin には数学用語でも2つの意味があります.

■binary(2進法)

decimal(10進法)は,ある数を0から9までの整数10個を係数に使って10の冪(べき)の和で表したとき,その係数を並べて表します.例えば234は,$$\begin{align} 200+30+4&=2\times10^2+3\times10^1+4\times10^0\\&=234\end{align}$$一方, binary(2進法)は,ある数を0と1のみを係数に使って2の冪の和で表したとき,その係数を並べて表します.例えば10進法の 234 は,$$\begin{align} 234&= 128+64+32+8+2\\ &= 2^7+2^6+2^5+2^3+2^1\\&=1\times2^7+1\times2^6+1\times2^5+0\times2^4+1\times2^30\times2^2+1\times2^1+0\times2^0\\&= 11101010_{(2)}\end{align}$$となり,2進法では$11101010_{(2)}$と表されます.

因みに,ファイルの拡張子で".bin"というのがありますが,テキストファイル".txt"以外のファイル,すなわち binary file のことで,2進数で表現されています.

■frequency distribution table(度数分布表)の class(階級)

frequency distribution table の class のことを bin ともいい,ある区間ごとに分類された小グループのひとつひとつ(histogram の各棒)を意味します.data binning とは、全データをいくつかの bin に分けることをいい,data bucketing ともいいます.data を分けて容器またはバケツに入れるというイメージでしょう.したがって,histogram を作ることも data binning のひとつといえます. 

# of data(データの数)を $n$ とし,それらを $x_1, x_2, ...., x_n$とします.すると,# of bins(階級の数)$k$ と bin width(階級の幅)$h$ との関係は次式で与えることができます.$$k=\frac{\max x_i-\min x_i}{h}\tag{1}$$または$$h=\frac{\max x_i-\min x_i}{k}\tag{2}$$つまり,$k$と$h$はデータの範囲を比例定数とする反比例の関係になります(値が整数にならない場合は切り上げます).

例えば,ある100点満点の試験を27名が受験した結果が次の値だったとしましょう.
76, 57, 47, 100, 47, 55, 83, 57, 49, 68, 73, 55, 68, 87, 91, 89, 37, 72, 63, 62, 57, 30, 77, 25, 60, 12, 66


$k$=10を上の式(2)に当てはめると,$$h=\frac{100-0}{10}=10$$すると$k$=10のとき$h$=10になり,frequency distribution table と graph は上図のようになります.しかし,特にこの値にしなければならないわけではありません.$$\frac{100-0}{5}=20$$なので,$k$=5のとき$h$=20,$k$=20のとき$h$=5になります.また,$$\left\lceil\frac{100-0}{7}\right\rceil=\left\lceil14.2857....\right\rceil=15$$
$\left\lceil\quad\right\rceil$は切り上げをする関数 ceiling function(天井関数)

なので,$k$=7のとき$h$=15,$k$=15のとき$h$=7になります.

この# of bins $k$とbin width $h$は data をよく眺めて直接決めてもいいのですが,実はこれらの適切な値についてはこれまでかなり研究されており,"choice","rule","formula"などと呼ばれる方法が知られています.# of data(データの数)$n$を基準にしたもの,SD=standard deviation(標準偏差)$\sigma$,IQR=interquartile range(四分位範囲)を使うものなどいろいろありますが,その中で$n$を基準にして$k$を求めるものは次の3つがあります.

① Square-root choice$$\displaystyle k=\lceil {\sqrt {n}}\rceil\displaystyle $$② Rice Rule(1944年)$$\displaystyle k=\lceil 2\sqrt[3]{n}\rceil \displaystyle$$
③ Sturges' formula(1926年)$$\displaystyle k=\lceil \log _{2}n\rceil +1$$$n$=27を代入すると,いずれも$k$=6になりますから,# of data $n$=27のときは # of bins $k$=6が適切ということになります.

①②③のグラフ

また,# of data $n$とSD=$\sigma$を使って$h$を求めるものに次式があります.

④ Scott’s Rule(1979年)$$\displaystyle h = \left\lceil\frac{3.49\sigma}{\sqrt[{3}]{n}}\right\rceil$$上の例の$\sigma$=20.7なので,$$\displaystyle h=\left\lceil\frac{3.49\times 20.7}{\sqrt[3]{27}}\right\rceil=\left\lceil24.08....\right\rceil=25$$となり,bin width $h$=25,# of bins $k$=4が適切ということになります.

[余談]

Excel で frequency distribution table を作るときに frequency を求める,すなわち多数のデータの中から各 bin width(階級の幅)の度数を数える方法は,「データ分析」「FREQUENCY関数」などを使うより「COUNTIFS関数」を使う方が比較的容易にできました.例えば,ある条件範囲から0以上10以下の数を数えるには次のように入力します.
=COUNTIFS (条件範囲, ">=0", 条件範囲, "<10")

●Excel で histogram と frequency distribution polygon(度数分布多角形)を重ねて描く方法をいろいろ試してみたところ,「挿入→ヒストグラム」「データ分析→ヒストグラム」から描くよりも次の方法が比較的容易でした.
1) グラフを描く準備として,上図のような3列(一番左の列はセルの書式設定で文字列にしておく)を作る.
2) その3列を選択
3) 挿入→おすすめグラフ→すべてのグラフ→組み合わせ→集合縦棒と折れ線→OK(棒グラフと折れ線グラフができる)
4) グラフの縦棒の上で右クリック→データ系列の書式設定→要素の間隔→0%(棒グラフがヒストグラムに変わる)→色を変える

●Excel で frequency distribution table を作る前の生データから histogram だけを作るときは「挿入→ヒストグラム」が楽です.Binの幅が自動的に決まって描かれますが,横軸部分を右クリックし、メニューから「軸の書式設定」を選択して,ビンの幅,ビンのオーバーフロウ,ビンのアンダーフロウを適切に決めればOKです.

[Reference]