授業名 | 統計学入門 |
---|---|
Course Title | Introduction to statistics |
担当教員 Instructor Name | 久保 明達(Akisato Kubo) |
コード Couse Code | NUC252_N24B |
授業形態 Class Type | 講義 Regular course |
授業形式 Class Format | On Campus |
単位 Credits | 2 |
言語 Language | JP |
科目区分 Course Category | 共通専門教育科目200系 / Specialized Subject 200 |
学位 Degree | BSc |
開講情報 Terms / Location | 2024 UG Nisshin Term3 |
授業の概要 Course Overview
Misson Statementとの関係性 / Connection to our Mission Statement
本学のMission Statement に従い、
本科目は、フロンティアにチャレンジし、ビジネスリーダーとしての役割を果たすために、十分な情報収集、分析力、コミュニケーション能力の養成を目指します。
本科目は、フロンティアにチャレンジし、ビジネスリーダーとしての役割を果たすために、十分な情報収集、分析力、コミュニケーション能力の養成を目指します。
Following to the Mission Statement of NUCB, this course aims for the education of information collecting, analysis and communication ability enough to challenge the frontier and lead business society.
授業の目的(意義) / Importance of this course
そのため本講義では、その世界規模の様々な情報の入手と分析(LG2,5,6,7)を行うための統計的思考力、分析力(LG1)を育成します。
それらを基にして、クラス討論グループ討論によって、効果的なコミュニケーション(LG4)の実践をします。
それらを基にして、クラス討論グループ討論によって、効果的なコミュニケーション(LG4)の実践をします。
For this purpose this course enables the student to develop one's ability of statistical thinking and analysis(LG1) for collecting and analyzing precisely various worldwide information(LG2,5,6,7). Based on them students practice the effective communication(LG4) on the class discussion and group discussion.
到達目標 / Achievement Goal
統計学は、経営学や経済学に、金融や保険の現場にも積極的に応用されています。このことを考慮して、本学のMissionを実現するために必要な統計的思考力、分析力、コミュニケーション能力を育成します。
最新の知識の修得、問題の解決には、統計的思考力、分析力、討論力が役立ちます。受講生が、経営学や経済学、金融や保険の学修に必要となる統計学の基礎事項を深く理解できるようにします。ケース・メソッドを導入し、実際に直面した場面での学生の積極的な発言を促し、グループ討議やクラス討議を行います。このような講義中の発言、貢献度、ディスカッションを高く評価します。
大学における以後のより進んだ学修及び仕事でも、必要となる力を育成します。
最新の知識の修得、問題の解決には、統計的思考力、分析力、討論力が役立ちます。受講生が、経営学や経済学、金融や保険の学修に必要となる統計学の基礎事項を深く理解できるようにします。ケース・メソッドを導入し、実際に直面した場面での学生の積極的な発言を促し、グループ討議やクラス討議を行います。このような講義中の発言、貢献度、ディスカッションを高く評価します。
大学における以後のより進んだ学修及び仕事でも、必要となる力を育成します。
Statistics is actively applied to the study of business administration, economics and finance or insurance as well. Taking that into account, this course enables students to develop their ability of statistical thinking, analysis and communication necessary for achieving NUCB's Mission.
The ability of statistical thinking, analysis and discussion is useful for getting the latest knowledge and solving issues. This course enables students to understand well some elemental basics of statistics, required for the study of business administration, economics, finance and insurance. Introducing the case method, supposed that they might face the case, they are strongly encouraged to state one's opinion, work on group discussion and class discussion, that are highly evaluated as class participation point.
This course enables students to develop the ability which is useful for the advanced study or business.
The ability of statistical thinking, analysis and discussion is useful for getting the latest knowledge and solving issues. This course enables students to understand well some elemental basics of statistics, required for the study of business administration, economics, finance and insurance. Introducing the case method, supposed that they might face the case, they are strongly encouraged to state one's opinion, work on group discussion and class discussion, that are highly evaluated as class participation point.
This course enables students to develop the ability which is useful for the advanced study or business.
本授業の該当ラーニングゴール Learning Goals
*本学の教育ミッションを具現化する形で設定されています。
LG1 Critical Thinking
LG2 Diversity Awareness
LG5 Business Perspectives (BSc)
LG6 Managerial Perspectives (BBA)
LG7 International Perspectives (BA)
LG2 Diversity Awareness
LG5 Business Perspectives (BSc)
LG6 Managerial Perspectives (BBA)
LG7 International Perspectives (BA)
受講後得られる具体的スキルや知識 Learning Outcomes
受講生は次のような能力と知識を得ることができます;統計学の基礎の理解、統計分析と実践的統計の手法、コンピュータの運用とコンピュータによるデータ処理のスキル、経営学や経済学分野等への応用力。
大学での学修及び社会人になってからの仕事で、最新の知識の修得、問題の解決に必要となる、統計的思考力、分析力、討論力が養われます。
大学での学修及び社会人になってからの仕事で、最新の知識の修得、問題の解決に必要となる、統計的思考力、分析力、討論力が養われます。
This course enables students to acquire the following capability and knowledge; the understanding of the foundation of statistics, and methods of statistical analysis and practical statics, computing skill and computational data processing skill, and the ability to apply one's knowledge to the fields of economics and business administration or others.
They can acquire the capability of statistical thinking, analysis and discussion, required for getting the latest knowledge and solving issues, on advanced studies at university as well as business after graduation.
They can acquire the capability of statistical thinking, analysis and discussion, required for getting the latest knowledge and solving issues, on advanced studies at university as well as business after graduation.
SDGsとの関連性 Relevance to Sustainable Development Goals
Goal 4 質の高い教育をみんなに(Quality Education)
教育手法 Teaching Method
教育手法 Teaching Method | % of Course Time | |
---|---|---|
インプット型 Traditional | 40 % | |
参加者中心型 Participant-Centered Learning | ケースメソッド Case Method | 60 % |
フィールドメソッド Field Method | 0 % | 合計 Total | 100 % |
事前学修と事後学修の内容、レポート、課題に対するフィードバック方法 Pre- and Post-Course Learning, Report, Feedback methods
次のような多面的な視点から評価を行います。
学習方法:予習のためのケース中で事前課題を適宜提示します。講義後は復習として、ノートの整理・補充等を通し、課題等に取り組み、予習と復習に合わせて1時間以上は費やしましょう。このようにして作成されたノートは、最終レポートの評価対象となります。
講義課題(小テストに含まれる):各回の講義の理解度を確認するためのものです。解答できるよう取り組みましょう。次の講義の中で解説します。
講義では、まず理論的内容に取り組み、その確認のための課題演習や小テスト等を行います。
また講義内容の理解を深めるためにコンピュータ演習を行います。
小テスト:講義中小テストを行った場合は、返却時に解説を行います。
最終レポート:1.講義ノートやテキストの内容を2000字以上でまとめたレポートを提出します。ノートは毎回講義の後にまとめておきましょう。2.講義全般の理解度を測るための最終課題を出し、レポートを提出します。
中央情報センターの利用:数学の基礎知識を修得するために、情報センターの文献の利用を勧めます。
学習方法:予習のためのケース中で事前課題を適宜提示します。講義後は復習として、ノートの整理・補充等を通し、課題等に取り組み、予習と復習に合わせて1時間以上は費やしましょう。このようにして作成されたノートは、最終レポートの評価対象となります。
講義課題(小テストに含まれる):各回の講義の理解度を確認するためのものです。解答できるよう取り組みましょう。次の講義の中で解説します。
講義では、まず理論的内容に取り組み、その確認のための課題演習や小テスト等を行います。
また講義内容の理解を深めるためにコンピュータ演習を行います。
小テスト:講義中小テストを行った場合は、返却時に解説を行います。
最終レポート:1.講義ノートやテキストの内容を2000字以上でまとめたレポートを提出します。ノートは毎回講義の後にまとめておきましょう。2.講義全般の理解度を測るための最終課題を出し、レポートを提出します。
中央情報センターの利用:数学の基礎知識を修得するために、情報センターの文献の利用を勧めます。
授業スケジュール Course Schedule
第1日(Day1)
(2章1節)1)講義ガイダンスを行います。講義の進め方、勉強の仕方、レポート課題などを説明します。
2)分布
沢山の値を含むデータについて、
どのような値がそれぞれどのくらいの度数(データ数)あるかを示したもののことを分布(グラフ)といいます。
3)データの種類:離散データと連続データ 質的データと量的データ 構造化データと非構造化データ
(2章2、3節)
4)データの代表値
沢山の値を含むデータを1つの数値で代表させようとするとき、その数値をデータの代表値といいます。
データの代表値としては平均値や中央値があります。
5)平均値
平均値とはデータの合計をデータ数で割った値であり、データ1つ当たりの値のことです。
6)中央値
中央値とはデータを大きさの順に並べたときに、真ん中の順位になる値の事です。
7)四分位範囲
四分位範囲とはデータの散らばりを表す値です。第三四分位数から第十四分位数を引いた値です。
●使用するケース
AKISATO KUBOBig Data Mining I(報道機関の公開資料)
ビッグデータとは
インターネットは我々にとってごく身近な環境となり、そこには様々なデータが氾濫しています。また、携帯が出す位置情報も、個人が発する情報です。これらはビッグデータと呼ばれています。現代では、このようなとりとめもなく、膨大なデータも統計学の対象として分析するようになりました。また、AIの発達により、より詳しい分析が可能になりつつあります。商品の売れ筋や渋滞、選挙の当落、景気感までが予測されるようになりました。
まずは身の回りのビッグデータを、質⇔量 連続⇔離散 構造化⇔非構造化、の視点から分類してみましょう。スマートフォン、GPS、SNS、運行情報、動画・画像・音声、人の移動、などについて考え、その特徴について考えてみましょう。
第2日(Day2)
1)標準偏差標準偏差とはデータの散らばり具合を表す値です。データがどのくらい散らばっているかを表す値です。
2)表で表した度数分布を分布表といい、グラフで表した場合を度数分布グラフといいます。
3)度数分布グラフを階級に分けて表したグラフを度数のヒストグラムといいます。
4)相対度数分布
度数分布で、度数の代わりに度数の割合をもちいた場合を相対度数分布といいます。
どのような値がそれぞれどのくらいの割合あるかを表したもののことです。
●使用するケース
AKISATO KUBOINFECTION I (政府および報道機関の公開資料)
グラフを読むI :現状の分析
ビッグデータを読み解くI
クルーズ船ダイヤモンド・プリンセス(DP)号
「香港で下りた1人だけが感染していると思っていた。10人の陽性で、最悪1000人感染しているんじゃないか。まずい・・・」
政府のある高官はつぶやいた。
2020年1月20日に横浜港を出港したクルーズ船ダイヤモンド・プリンセス(DP)号には、世界57カ国から船員1,068人, 乗客2,645人の計3,713人が乗船していた。この乗客で, 1月25日に香港で下船した80代男性が新型コロナウイルス感染症(COVID-19)に罹患していたことが2月1日確認された(1月19日咳発症)。2月2日に香港から同報告を受けた厚生労働省は, 2月1日那覇港寄港時に検疫を受けたDP号船員乗客に対し, 2月3日に再度横浜港で検疫を実施、5日10名の陽性者を確認、その後4月15日までに確定症例712例が確認され, 少なくとも14例の死亡が確認された(致命率2.0%)。そのとき対策のため外部から乗船した検疫官や医師らの感染も確認され、いかにこの感染症が、その性質と感染規模において、これまでの我々の医学的常識を覆す過去に類を見ない未曽有のものであるのかを実感させることになった。
日々刻々新規感染者数とそのグラフがテレビ、新聞、インターネットを通じて報道される、それを見て我々はどう読み解いていけばよいのであろうか。
次のグラフは、国内で感染が始まってからの累計患者数である。現状を分析し、これからどうなるのか考えてみよう。
図1
また、これまでにコロナ感染症についての膨大で様々なビッグデータについて分析がなされWEB上で検索することができる。これらを調べることでビッグデータが、コロナウィルスの正体の解明、ワクチンの開発を促進したかのみならず、どのように我々の生命と生活を守るのに役立ってきたかなどについて垣間見ることができる。これらについても、クラスディスカッションを行いたい。
第3日(Day3)
2章3節)1)相関係数
相関係数とは、2組のデータが座標平面上で直線的に並んでいるか否かを表す値です。
直線的に並んでいると、2組のデータは強い相関であると言われます。
2)回帰分析
複数の変数の間の関係を調べるのに、回帰分析がよく使われます。
回帰分析は、データに最も近い直線を引くというのが基本的な考え方です。
(3章1節ー2節)
もとのデータ(=母集団データ)の調べ方には、全数調査と標本調査の2つの方法があります。
2)全数調査と標本調査
全数調査とは、母集団データの全数を調べることです。
標本調査とは、母集団データから一部を抜き出して値を調べて、母集団データ全体を推定することです。
ここで抜き出した値を標本とよびます。
(4章1節)
1)標本の平均値の分布:
母集団データから標本を抜き出し、標本の平均値の値を考えるとき、標本の平均値の値として可能な値全体の相対 度数分布を、標本の平均値の分布とよびます。
(4章2節)
2)中心極限定理
母集団データから標本nを抜き出し標本の平均値の分布をつくるとき、
標本nの数を増やしていくにつれて、対応する標本の平均値の分布は徐々に正規分布に近づいていくことを中心極限 定理といいます。
●使用するケース
AKISATO KUBOBig Data Mining II(報道機関の公開資料)
ツイッターは株の値動きを約90%の的中率で予想できるか
2010年「ツイッター(Twitter)」でユーザーたちが書き込む「つぶやき(ツイート)」を分析すると、数日後のダウ工業株30種平均(Dow Jones Industrial Average)の値動きを約90%の的中率で予測できるという衝撃的な研究結果が世界中を駆け巡り、ビッグデータそのものにも大きな注目が集まりました。
分析の元となったデータ は、米インディアナ大学ブルーミントン校(Indiana University Bloomington)情報コンピューティング学部の研究チーム(大学院生フイナ・マオ氏と准教授ヨハン・ボーレン氏、マイクロソフトリサーチのスコット・カウンツ氏の3氏)が2008年に10か月かけて集めたユーザー270万人による延べ980万回のツイートでした。
研究の発端となったのは、ツイートから「集団的な世論の気分」(景気感)を評価し、それをダウの終値と比較したところ、相関性があることが分かったことにあります。
実際、分析の結果「ダウ工業株価の毎日の値動きの予測的中率は87.6%という高さだった」。ツイートの分析には、気分追跡ツールの「OpinionFinder」とグーグルの「気分プロフィール検査」(POMS)を使用したとのことです。
ビッグデータはどのように分析されるのか、考えてみましょう。
第4日(Day4)
1)確率分布沢山の値を含む母集団データからデータを一つ抜き出すとき、
どのような値が、それぞれどのくらいの確率で抜き出されるかを表したもので、データの確率分布といいます。
2)正規分布
正規分布は、確率分布のなかで最も有名な確率分布です。
形は左右対称の山型で、よく富士山型とよばれます。
(4章1節)
1)標本の平均値の分布:
母集団データから標本を抜き出し、標本の平均値の値を考えるとき、標本の平均値の値として可能な値全体の相対 度数分布を、標本の平均値の分布とよびます。
●使用するケース
AKISATO KUBOINFECTION II (政府および報道機関の公開資料)
グラフを読む II:人口増加、経済原理、感染症の拡大との関連
ビッグデータを読み解くII
次のグラフは、国内で感染が始まってからの累計患者数である。経済原理との関連について考えてみよう。
図2
数理生物学の研究結果より、感染症の累計感染者数と市場の拡大の原理が同じロジスティック曲線で表されることで、その共通する原理は何でしょうか。
図3
またロジスティック曲線の性質を用いて、これからの感染症の推移について考えてみよう。
第5日(Day5)
(4章3節)p値による仮説検定
片側検定と両側検定
「賭博師と私のやり取」りを仮説検定で実証する。
1)統計的検定の考え方(統計的検定の4つのステップは次の通りです)
1. 帰無仮説を立てます(証明したいことをその対立仮説とします)。
2. 有意水準とよばれる判定基準を決めそれに伴うp値を求める。
3. p値が有意水準より大きいか小さいかを比べる。
これより帰無仮説が正しいかを判定する。
片側検定と両側検定
「賭博師と私のやり取」りを仮説検定のやり方をトレーニングする。
中心極限定理に基づいた正規分布を利用して検定を行います。
●使用するケース
AKISATO KUBOProbability (報道機関の公開資料)
「マジ」を科学する
江戸時代には主に芸人の楽屋言葉として使用されたが、1980年代に若者言葉として流行し、マジに「本気」や「真剣」などの漢字も当られるようになった。
1980年代に「マジ」が流行したのは、日本社会において従来の「真面目」が崩壊したことにより、別な言いまわしで「真面目」を表す言葉が必要になったものと考えられる。
この流行以降、「マジバナ」「マジギレ」「マジ顔」など、「マジ〜」の形の語も多く作られた。「マジか〜」に至っては、ドン.キホーテのテーマソングで使われているほどで、すでに我々の日常生活に定着した感がある。すなわち闇雲に「マジ」を使う流行期が過ぎた現在の状況を改めて観察してみると、相手との間に「マジ」を使うべきある共通認識が成立するときに使っていることがわかる。それは数理的に言えばどういう場合であるか?普段何気なくつかっている言葉の中に、印象に残った場面や時を客観的に思い返すことで、そこに大事な統計的考え方のヒントが隠されていやしまいか、科学的視点に立って考えてみよう。
第6日(Day6)
(5章1節)2)母集団データの平均値の検定1(t検定)
母集団データの平均値の値がいくつなのかについての検定は、
正規分布と近い関係にあるt分布とよばれる確率分布を利用して検定を行います。
そしてt分布を用いた検定をt検定とよびます。
データ数が多い場合
(5章2節)
1)母集団データの平均値の検定2(t検定)
データ数が少ない場合
●使用するケース
AKISATO KUBO(WEB公開資料)INFECTION III:Risk Management
中国の武漢で発生したちまち感染拡大したCOVID-19は、すぐに周辺諸国に拡散し、日本では水際での検疫により何とか国内への感染を食い止めていたが、その潜伏期間の長さから、海外に滞在し、無症状のまま帰国した人達がその後発症し、国内感染が始まった。
事実上最初の感染爆発が起こったクルーズ船ダイヤモンド・プリンセス号において(INFECTION I 参照)、アメリカ人乗船者グループは、混乱し錯綜する日本からの情報よりも、アメリカ疾病予防管理センター(CDC)を主とするこの感染爆発の情報を逐次インターネットを通じて収集し、客観的で的確な独自のリスクマネージメントを行った例をあげ、情報とその統計的分析を用いたリスクマネージメントについて考える。
第7日(Day7)
(6章3節)1)その他の検定
広い分野で利用される、様々な検定について解説します。ビッグデータの分析についても考えます。
これまでの復習と総まとめを行います。
●使用するケース
AKISATO KUBO(WEB公開資料)Vaccine Efficiency (報道機関の公開資料)
ワクチンの有効性は統計確率的にどう保証されるか
まだ第一波のコロナ感染の最中に発表され、世界中にセンセーションを巻き起こした、モデルナのワクチンの有効性についての論文:
”Efficacy and Safety of the mRNA-1273 SARS-CoV-2 Vaccine”
について、これまでの学習によって、我々は仮説検定の観点から読むことができる十分な知識を持っているといえる。
成績評価方法 Evaluation Criteria
*成績は下記該当項目を基に決定されます。
*クラス貢献度合計はコールドコールと授業内での挙手発言の合算値です。
なお最終レポートは、1.講義の内容を2000字以上で、2.「予習レポート」(講義後の訂正版)と「講義課題」(回答後の訂正版)も含めてまとめ、講義ノートレポートとして提出します。期末試験(30%)。
また、状況に応じてこれらの割合は変わることがあり、そのときは講義中に改めて説明します。
*クラス貢献度合計はコールドコールと授業内での挙手発言の合算値です。
講師用内規準拠 Method of Assessment | Weights |
---|---|
コールドコール Cold Call | 10 % |
授業内での挙手発言 Class Contribution | 20 % |
クラス貢献度合計 Class Contribution Total | 30 % |
予習レポート Preparation Report | 10 % |
小テスト Quizzes / Tests | 10 % |
シミュレーション成績 Simulation | 0 % |
ケース試験 Case Exam | 0 % |
最終レポート Final Report | 20 % |
期末試験 Final Exam | 30 % |
参加者による相互評価 Peer Assessment | 0 % |
合計 Total | 100 % |
評価の留意事項 Notes on Evaluation Criteria
「講義中の挙手発言」には、講義参加度、出席状況も含まれる(30%)。これに関連して予習レポート(10%)、期末試験に関連して講義の理解度を確認するための講義課題(小テストに含まれる、10%)。最終レポート(20%)の出来具合は、当該パーセンテージを超えて評価することがあります。また場合によってはその逆もあり得ます。講義への積極的参加を歓迎します。なお最終レポートは、1.講義の内容を2000字以上で、2.「予習レポート」(講義後の訂正版)と「講義課題」(回答後の訂正版)も含めてまとめ、講義ノートレポートとして提出します。期末試験(30%)。
また、状況に応じてこれらの割合は変わることがあり、そのときは講義中に改めて説明します。
教科書 Textbook
- 涌井良幸 涌井貞美「統計学の図鑑」技術評論社(2015)978-4774173313
参考文献・資料 Additional Readings and Resource
1)藤田岳彦著「穴埋め式確率・統計らくらくワークブック」講談社、2003年(ISBN:4061539949)
2)小島寛之著「完全独習 統計学入門」ダイヤモンド社、2006年(ISBN:4478820090)
3)西内啓 著「統計学が最強の学問である」ダイヤモンド社、2013年(ISBN:4478022216)
4)涌井良幸 涌井貞美 著「文系のための統計学の教室」SBクリエイティブ 2020(ISBN: 9784815601539)
5)涌井良幸 著 「統計力クイズ」実務教育出版 2015(ISBN:9784788911505)
2)小島寛之著「完全独習 統計学入門」ダイヤモンド社、2006年(ISBN:4478820090)
3)西内啓 著「統計学が最強の学問である」ダイヤモンド社、2013年(ISBN:4478022216)
4)涌井良幸 涌井貞美 著「文系のための統計学の教室」SBクリエイティブ 2020(ISBN: 9784815601539)
5)涌井良幸 著 「統計力クイズ」実務教育出版 2015(ISBN:9784788911505)
授業調査に対するコメント Comment on Course Evaluation
授業調査という制度を講義の充実のために有効活用します。
一方的な講義にならないように、可能な限り各種討論を実施するなど、
できるだけ受講生が講義に参加しやすい講義を行うように試みます。
各種課題(小テスト、講義課題、最終レポートを含む)を受講生の理解度や負担を考慮しつつ出題します。
分かりやすい平易で簡潔な説明を心がけます。
一方的な講義にならないように、可能な限り各種討論を実施するなど、
できるだけ受講生が講義に参加しやすい講義を行うように試みます。
各種課題(小テスト、講義課題、最終レポートを含む)を受講生の理解度や負担を考慮しつつ出題します。
分かりやすい平易で簡潔な説明を心がけます。
担当教員のプロフィール About the Instructor
学位と取得大学
理学修士(早稲田大学)
理学博士(早稲田大学)
理学修士(早稲田大学)
理学博士(早稲田大学)
Degree and Acquired College
Master of Science(Waseda University)
Doctor of Science(Waseda University)
Refereed Proceedings
- (2024). Non-linear evolution equations with non-local coefficients and zero-Neumann conditions:one dimensional case. Analysis, Application, and Computations, Birkhauser, Springer, 647-658 .the 13th ISAAC Congress. 1. 3. Ghent, Belgium