プロセッサコアの数は何ですか? 電話機のプロセッサ コアの数は何ですか? それは何を担当し、どのような機能を実行しますか? スマートフォンのコア数はどのような影響を及ぼしますか? スマートフォンの最大コア数はいくつですか? 体のコアの数は何を意味しますか?

28.04.2019 ルーターとモデム

モバイル プロセッサのコア、その機能、必要な数量について、簡単な言葉でまとめた短編小説。

ナビゲーション

新しいスマートフォンを購入しようと決めた人にとって、主な選択基準は価格だけでなく、ガジェットの性能も重要です。 あるオンラインストアのWebサイトにアクセスしてスマートフォンの技術的特性を開くと、その中に「プロセッサ」などの定義が表示されます。

多くのユーザーは、技術的に文盲のユーザーであっても、この部分に精通しており、それがどのような機能を実行するかについてのアイデアを持っています。 ただし、その隣にある「デュアルコア」または「クアッドコア」という言葉は、多くの人にとって混乱を引き起こします。

この記事では、スマートフォンのプロセッサ コアとは何なのか、その役割は何なのか、そしてプロセッサのコアが増えるほど携帯電話の性能が向上するという意見が本当かどうかについて説明します。

電話機のプロセッサとは何ですか?

  • コアに進む前に、まずプロセッサとは何かを理解する必要があります。 プロセッサは、人間がマシンコードに入力する数学的、論理的および管理操作を担当する小型デバイスです。
  • 原則として、プロセッサは 1 つのプロセッサとして設計されています。 集積回路、その基礎はシリコンチップとその上に配置された膨大な数のトランジスタです。 場合によっては、プロセッサは 2 つ以上の特殊なチップで構成される場合があります。

  • プロセッサの速度または能力は、シリコン チップ上に配置されたトランジスタの総数に直接依存します。 プロセッサーの電力はクロック周波数 ( GHz) シリコンチップ上に配置されるトランジスタの数が増えるほど、 クロック周波数プロセッサー (電源)。
  • ただし、トランジスタを流れる電流によりシリコンチップが加熱される傾向があり、高温にさらされるとシリコンチップが故障します。 そして、チップ上のトランジスタの数が増えるほど、チップの加熱が速くなり、熱限界に達します。 過熱を避けるために、2 つ以上のコアを備えたプロセッサが発明されました。

スマートフォンのプロセッサ コアは何ですか?また、それらは何を担当しますか?

  • コアは、すべての情報が処理され、計算が行われるメイン プロセッサ モジュールです。 人体に例えると、プロセッサーは脳であり、核はその半球です。 U 人間の脳それらは 2 つありますが、スマートフォンのプロセッサ コアの数は 8 つに達することがあります。

  • 上で、プロセッサの能力がプロセッサに適用されるトランジスタの数に依存するという事実について説明し、過熱についても触れました。 プロセッサーにかかる負荷をコア間で分散し、熱放散を減らすために、プロセッサー内に複数のコアが存在することが必要です。
  • したがって、1 つのコアが処理中の情報の流れに対応できない場合、2 番目のコアが自動的に起動して作業の一部を引き継ぎ、過熱を防ぎます。 プロセッサーに 2 つ以上のコアが存在すると、より多くのトランジスタを搭載できるため、プロセッサーの電力やデータ処理速度が向上します。

スマートフォンのコア数はどのような影響を及ぼしますか?

  • すでにわかったように、コアはプロセッサーの負担を軽減し、熱放散を減らし、速度を向上させるのに役立ちます。 したがって、携帯電話に搭載されているプロセッサのコア数が多いほど、同時に実行できるアクションの数も多くなります。

  • たとえば、シングルコア プロセッサを搭載したスマートフォンを使用していて、そのスマートフォンでゲームをプレイしていて、いくつかの 2 番目のアプリケーションを並行して実行したい場合、プロセッサはそのような大きなデータを同時に処理できないため、ゲームは自動的に終了します。ストリーム。
  • デュアルコア プロセッサで同じことを行うと、そのコアの 1 つがゲームの作業を引き継ぎ、2 つ目のコアが実行中のアプリケーションを処理します。
  • 複数のプロセッサ コアを同時にロードする重いアプリケーションもあります。 それらはマルチスレッドと呼ばれます。 これらには、重いゲームや一部のグラフィック エディターが含まれます。 シングルコアプロセッサを搭載したスマートフォンでそのようなアプリケーションを実行しようとしても、せいぜい起動しないだけです。 最悪のシナリオは、デバイスが完全にフリーズして過熱する可能性があります。

スマートフォンの最大コア数はいくつですか?

  • 現在、プロセッサーには、 最大数 10コア。 確かにもっと多くのものが存在する可能性がありますが、開発者は現時点ではその必要性を認識していません。
  • しかし、プロセッサメーカーの視点にもかかわらず、多くのアナリストや専門家は、ガジェットの未来はマルチタスクにあり、マルチコアプロセッサの存在なしでは不可能であるという意見を持っています。

携帯電話やスマートフォンには何コアありますか?

  • 多くの購入者は、8 コア プロセッサはクアッド コア プロセッサの 2 倍の性能があると考えています。 プロセッサー設計の詳細に立ち入らず、論理的な観点から考えると、8 個は 4 個より大きく、ガジェットのパワーがより高くなります。 しかし、この意見は根本的に間違っています。
  • すでに述べたように、プロセッサ コアの数により、同時に実行されるプロセスが均等に分散されるため、スマートフォンの速度が向上します。 しかし、今日存在するもののほとんどは モバイルアプリケーションはシングルスレッドであり、一度に 1 つのプロセッサ コアのみを使用できます。 まれに2つもあります。

  • マルチコア プロセッサは、次のような重いゲームをプレイする場合にのみ必要です。 高負荷プロセッサごとに 4 つ以上のコアを同時に使用できます。 ゲーム業界の開発者は、売上を増やすために、たとえ性能の低いデバイスに対しても製品を最適化しようとしているため、現在そのようなゲームはほんのわずかしかありません。
  • タイトルの質問に明確な答えを与えることは不可能です。 それはすべてあなたのニーズによって異なります。 技術特性デバイス全般。 ゲーム用に優れたスマートフォンが必要な場合は、プロセッサ コアの数だけでなく、クロック周波数や RAM の量にも注意を払う必要があります。

  • たとえば、次のようなスマートフォン 4ギガバイト RAM、クアッドコアプロセッサー、クロック速度 1.7GHzよりもはるかに高速になります 同様のスマートフォン 8コアプロセッサとクロック速度を搭載 1GHz.
  • プロセッサデバイスも重要な役割を果たします。 メーカーごとにプロセッサの構造が異なります。 たとえば、メーカーのプロセッサー 原子そして キンギョソウ同じコア数とクロック速度でもパフォーマンスが異なります。

ビデオ: モバイル プロセッサのコア数が多いほど良いとは限らないのはなぜですか?

  • チュートリアル

この記事では、複数のプログラムを並行して実行できるシステム、つまりマルチコア、マルチプロセッサ、マルチスレッドを説明するために使用される用語について説明します。 IA-32 CPU では、さまざまなタイプの並列処理がさまざまな時期に、やや一貫性のない順序で登場しました。 特に、オペレーティング システムがあまり洗練されていないアプリケーション プログラムの詳細を慎重に隠していることを考えると、これらすべての点で混乱するのは非常に簡単です。

この記事の目的は、マルチプロセッサ、マルチコア、マルチスレッド システムのさまざまな構成が考えられるため、それらのシステム上で実行されるプログラムに対して、抽象化 (違いを無視) する機会と、詳細を考慮する機会の両方が生まれることを示すことです。 (プログラムで構成を確認する機能)。

記事中の®、™記号についての注意

私のコメントは、会社の従業員が公共のコミュニケーションにおいて著作権表示を使用すべき理由を説明しています。 この記事では、これらをかなり頻繁に使用する必要がありました。

CPU

もちろん、最も古く、最も頻繁に使用され、物議を醸している用語は「プロセッサー」です。

現代の世界では、プロセッサーは美しい小売箱か、あまり良くない OEM パッケージで購入されるものです。 マザーボード上のソケットに挿入される分割不可能なエンティティ。 コネクタがなくても取り外せなくても、つまりしっかり半田付けされていれば1チップです。

モバイル システム (電話、タブレット、ラップトップ) とほとんどのデスクトップには 1 つのプロセッサが搭載されています。 ワークステーションやサーバーには、1 つのマザーボード上に 2 つ以上のプロセッサが搭載されている場合があります。

単一システムで複数の CPU をサポートするには、多くの設計変更が必要です。 少なくとも、それらを提供する必要があります 物理的な接続(マザーボード上に複数のソケットを用意する)、プロセッサの識別の問題を解決する (この記事の後半と以前のメモを参照)、メモリ アクセスと割り込み配信の調整 (割り込みコントローラは割り込みを複数のプロセッサにルーティングできる必要がある)そしてもちろん、オペレーティング システムによるサポートも提供されます。 残念ながら、Intel プロセッサによる最初のマルチプロセッサ システムの作成についての文書は見つかりませんでしたが、Wikipedia によると、Sequent Computer Systems は 1987 年にすでに Intel 80386 プロセッサを使用してマルチプロセッサ システムを提供しており、1 つのシステムでの複数のチップのサポートが普及しつつあります。インテル® Pentium から始まります。

複数のプロセッサがある場合、それぞれのプロセッサがボード上に独自のコネクタを持ちます。 それぞれに、レジスタ、実行デバイス、キャッシュなどのすべてのリソースの完全に独立したコピーがあります。 これらは共通のメモリ、つまり RAM を共有します。 記憶はさまざまな、そしてむしろ自明ではない方法でそれらに結び付けられますが、これはこの記事の範囲を超える別の話です。 重要なことは、いずれにしても、 実行可能プログラムシステムに含まれるすべてのプロセッサからアクセスできる同種の共有メモリのような錯覚を生み出す必要があります。


離陸の準備ができて! インテル® デスクトップ・ボード D5400XS

歴史的には、インテル IA-32 のマルチコアはインテル® ハイパースレッディングよりも後に登場しましたが、論理階層では次に登場します。

システムのプロセッサ数が多いほど、(すべてのリソースを使用できるタスクでの) パフォーマンスが向上するように見えます。 ただし、それらの間の通信コストが高すぎる場合、共通データの転送に長い遅延が発生するため、並列処理によるすべての利点が失われます。 これはまさにマルチプロセッサ システムで観察されることです。物理的にも論理的にも互いに非常に離れています。 このような状況で効果的に通信するには、インテル® QuickPath インターコネクトなどの特殊なバスを考案する必要があります。 もちろん、最終ソリューションのエネルギー消費量、サイズ、価格は、これらすべてによって削減されるわけではありません。 コンポーネントの高集積化が助けになる必要があります。並列プログラムの一部を実行する回路は、できれば 1 つのチップ上に、互いに近づける必要があります。 言い換えれば、1 つのプロセッサが複数のプロセッサを組織する必要があります。 コア、すべてにおいて互いに同一ですが、独立して動作します。

Intel の最初のマルチコア IA-32 プロセッサは 2005 年に導入されました。 それ以来、サーバー、デスクトップ、そして現在のモバイル プラットフォームの平均コア数は着実に増加しています。

同じシステム上の 2 つのシングルコア プロセッサがメモリのみを共有するのとは異なり、2 つのコアはキャッシュやその他のメモリ関連リソースも共有できます。 ほとんどの場合、第 1 レベルのキャッシュはプライベートのまま (各コアに独自のキャッシュがあります)、第 2 レベルと第 3 レベルは共有または分離できます。 このシステム構成により、特に隣接するコアが共通のタスクに取り組んでいる場合、隣接するコア間のデータ配信の遅延を軽減できます。


コードネーム Nehalem というクアッドコア Intel プロセッサの顕微鏡写真。 個別のコア、共通の 3 次キャッシュ、および他のプロセッサへの QPI リンクと共通のメモリ コントローラが割り当てられます。

ハイパースレッド

2002 年頃までは、2 つ以上のプログラムを並行して実行できる IA-32 システムを入手する唯一の方法は、マルチプロセッサ システムを使用することでした。 Intel® Pentium® 4 および開発コード名 Foster (Netburst) の Xeon ラインが導入されました 新技術- ハイパースレッドまたはハイパースレッド、 - インテル® ハイパースレッディング (以下、HT)。

太陽の下に新しいものは何もありません。 HTは 特別なケース文献では同時マルチスレッド (SMT) と呼ばれるものです。 完全で独立したコピーである「実際の」コアとは異なり、HT の場合、主にアーキテクチャ状態の保存を担当する内部ノードの一部 (レジスタ) のみが 1 つのプロセッサ内で複製されます。 データの編成と処理を担当する実行ノードは単一のままであり、常に 1 つのスレッドによってのみ使用されます。 コアと同様に、ハイパースレッドはキャッシュを共有しますが、どのレベルからかは特定のシステムによって異なります。

SMT 設計全般、特に HT 設計の長所と短所をすべて説明するつもりはありません。 興味のある読者は、このテクノロジーに関する詳細な説明を多くの情報源、そしてもちろん Wikipedia で見つけることができます。 ただし、以下の点に注意します 大事なポイント、実際の運用環境におけるハイパースレッド数の現在の制限について説明します。

スレッドの制限
HT の形で「不公平な」マルチコアの存在が正当化されるのはどのような場合ですか? 1 つのアプリケーション スレッドがカーネル内のすべての実行ノードをロードできない場合、それらの実行ノードを別のスレッドに「貸し出す」ことができます。 これは、計算ではなくデータ アクセスにボトルネックがあるアプリケーション、つまりキャッシュ ミスが頻繁に発生し、メモリからデータが配信されるまで待機する必要があるアプリケーションによく見られます。 この間、HT のないコアは強制的にアイドル状態になります。 HT の存在により、空き実行ノードを (複製されているため) 別のアーキテクチャ状態にすばやく切り替えて、その命令を実行できます。 これは、レイテンシ隠蔽と呼ばれる手法の特殊なケースで、1 回の長い操作で、その間に 有用なリソースアイドル状態。他のタスクの並列実行によってマスクされます。 アプリケーションがすでにカーネル リソースを高度に使用している場合、ハイパースレッドの存在によって高速化は実現できません。ここでは「正直な」カーネルが必要です。

マシン アーキテクチャ向けに設計されたデスクトップおよびサーバー アプリケーションの一般的なシナリオ 一般的用途 HT によって並列処理が可能になる可能性があります。 しかし、この可能性はすぐに使い果たされてしまいます。 おそらくこの理由から、ほとんどすべての IA-32 プロセッサでは、ハードウェア ハイパースレッドの数は 2 を超えません。 の上 典型的なシナリオ 3 つ以上のハイパースレッドを使用することで得られる利益は小さいですが、ダイ サイズ、消費電力、コストの損失は大きくなります。

ビデオ アクセラレータで実行される一般的なタスクでは、別の状況が観察されます。 したがって、これらのアーキテクチャは、より多くのスレッドを備えた SMT テクノロジを使用することを特徴としています。 インテル® Xeon Phi コプロセッサー (2010 年に導入) は、思想的および系譜的にビデオ カードに非常に近いため、 各コアのハイパースレッディング - IA-32 に固有の構成。

論理プロセッサ

説明されている並列処理の 3 つの「レベル」 (プロセッサ、コア、ハイパースレッド) のうち、一部またはすべてが特定のシステムで欠落している可能性があります。 これは、BIOS 設定 (マルチコアとマルチスレッドは個別に無効になっています)、マイクロアーキテクチャ機能 (たとえば、インテル® Core™ Duo には HT がありませんでしたが、Nehalem のリリースで復活しました)、およびシステム イベント (マルチコアプロセッササーバーは、障害が検出された場合に障害が発生したプロセッサをシャットダウンし、残りのプロセッサで「飛行」を続けることができます。 この同時実行性のマルチレベルの動物園は、オペレーティング システム、そして最終的にはアプリケーション アプリケーションにどのように表示されるのでしょうか?

さらに、便宜上、特定のシステム内のプロセッサ、コア、スレッドの数を 3 で表します ( バツ, y, z)、 どこ バツはプロセッサの数、 y- 各プロセッサーのコア数、および z- 各コアのハイパースレッドの数。 これからはこれを3つと呼びます トポロジー- 数学の分野とはほとんど関係のない確立された用語。 仕事 p = xyz呼び出されるエンティティの数を定義します 論理プロセッサシステム。 これは、オペレーティング システムが強制的に考慮する必要がある、共有メモリ システム上で並列実行されるアプリケーション プロセスの独立したコンテキストの総数を定義します。 「強制」と言ったのは、異なる論理プロセッサ上の 2 つのプロセスの実行順序を制御できないためです。 これはハイパースレッドにも当てはまります。ハイパースレッドは同じコア上で「順次」実行されますが、特定の順序はハードウェアによって決定され、プログラムによって監視または制御することはできません。

ほとんどの場合、オペレーティング システムは、それが実行されているシステムの物理トポロジの機能をエンド アプリケーションから隠します。 たとえば、次の 3 つのトポロジ: (2, 1, 1)、(1, 2, 1)、および (1, 1, 2) - OS は 2 つの論理プロセッサを表しますが、最初のプロセッサには 2 つのプロセッサがあり、 2 番目 - 2 つのコア、3 番目 - 2 つのスレッドのみ。


Windows タスク マネージャーには 8 つの論理プロセッサが表示されます。 しかし、プロセッサ、コア、ハイパースレッドではどれくらいになるのでしょうか?


Linux の上部には 4 つの論理プロセッサが表示されます。

これはクリエイターにとって非常に便利です アプリケーションアプリケーション- 彼らにとって重要でないことが多い機器の機能を扱う必要がありません。

トポロジのソフトウェア定義

もちろん、トポロジを 1 つの論理プロセッサに抽象化すると、場合によっては混乱や誤解が生じる十分な根拠が生じます (インターネット上の激しい論争では)。 ハードウェアから最大限のパフォーマンスを引き出したいコンピューティング アプリケーションでは、スレッドを配置する場所を詳細に制御する必要があります。つまり、隣接するハイパースレッド上で相互に近づけたり、逆に、より遠くに配置したりする必要があります。 異なるプロセッサ。 同じコアまたはプロセッサ内の論理プロセッサ間の通信速度は、プロセッサ間のデータ転送速度よりもはるかに高速です。 作業記憶の構成に不均一性がある可能性も状況を複雑にします。

システム全体のトポロジに関する情報と、IA-32 内の各論理プロセッサの位置は、CPUID 命令を使用して取得できます。 最初のマルチプロセッサ システムの出現以来、論理プロセッサ識別スキームは数回拡張されてきました。 現在までに、その部分は CPUID のシート 1、4、および 11 に含まれています。 どのシートを参照するかは、記事から引用した次のフローチャートから判断できます。

ここで詳細を説明するつもりはありません。 個々の部品このアルゴリズム。 ご興味がございましたら、この記事の次の部分でこれについて説明してください。 興味のある読者には、この問題をできる限り詳細に考察した資料を参照してください。 ここでは、まず APIC とは何か、そして APIC がトポロジにどのように関係するのかについて簡単に説明します。 次に、現在「apico-building」の最後の単語である 0xB シート (10 進数で 11) の操作を見ていきます。

APIC ID
ローカル APIC (高度なプログラマブル割り込みコントローラー) は、特定の論理プロセッサーに届く割り込みを処理する役割を担うデバイス (現在はプロセッサーの一部) です。 各論理プロセッサには独自の APIC があります。 そして、システム内のそれぞれが持っている必要があります ユニークな価値 APIC ID。 この番号は、割り込みコントローラがメッセージ配信時のアドレス指定に使用し、他のすべてのユーザー (オペレーティング システムなど) が論理プロセッサを識別するために使用します。 この割り込みコントローラーの仕様は、Intel 8259 PIC からデュアル PIC、APIC、xAPIC を経て x2APIC に進化しました。

現在、APIC ID に格納される数値の幅は 32 ビットに達していますが、以前は 16 ビットに制限されており、さらに以前は 8 ビットに制限されていました。 現在、CPUID には昔の名残が散在していますが、CPUID.0xB.EDX は APIC ID の 32 ビットすべてを返します。 CPUID 命令を独立して実行する各論理プロセッサでは、異なる値が返されます。

家族の絆を明確にする
APIC ID 値自体は、トポロジについては何も示しません。 どの 2 つの論理プロセッサが 1 つの物理プロセッサ内にあるのか (つまり、「兄弟」ハイパースレッドであるのか)、どの 2 つが同じプロセッサ内にあるのか、どのプロセッサが完全に異なるプロセッサなのかを確認するには、それらの APIC ID 値を比較する必要があります。 関係の程度に応じて、それらのビットのいくつかは一致します。 この情報は、ECX でエンコードされたオペランドである CPUID.0xB サブリストに含まれています。 それらのそれぞれは、EAX のトポロジ レベルの 1 つのビット フィールドの位置 (より正確には、下位のトポロジ レベルを削除するために APIC ID 内で右にシフトする必要があるビット数) と、 ECX のこのレベルのタイプ (ハイパースレッド、コア、プロセッサー)。

同じコア内にある論理プロセッサの場合、SMT フィールドに属するビットを除くすべての APIC ID ビットが一致します。 同じプロセッサ内にある論理プロセッサの場合、コア フィールドと SMT フィールドを除くすべてのビット。 CPUID.0xB のサブシートの数は増加する可能性があるため、将来必要になった場合、このスキームにより、より多くのレベルのトポロジの記述をサポートできるようになります。 さらに、既存のレベルの中間レベルを導入することも可能になります。

このスキームの構成の重要な結果は、システムのすべての論理プロセッサのすべての APIC ID のセットに「穴」が存在する可能性があることです。 彼らは順番に進みません。 たとえば、HT がオフになっているマルチコア プロセッサでは、ハイパースレッド番号のエンコードを担当する最下位ビットが常に 0 になるため、すべての APIC ID が偶数になる可能性があります。

オペレーティング システムが利用できる論理プロセッサに関する情報のソースは CPUID.0xB だけではないことに注意してください。 利用可能なすべてのプロセッサのリストとその APIC ID 値は、MADT ACPI テーブルにエンコードされます。

オペレーティング システムとトポロジ

オペレーティング システムは、独自のインターフェイスを使用して、論理プロセッサのトポロジに関する情報をアプリケーションに提供します。

Linux情報トポロジ情報は、/proc/cpuinfo 疑似ファイルおよび dmidecode コマンドの出力に含まれています。 以下の例では、HT を使用しないクアッドコア システム上の cpuinfo の内容をフィルタリングして、トポロジに関連するエントリのみを残します。

隠しテキスト

ggg@shadowbox:~$ cat /proc/cpuinfo |grep "processor\|physical\ id\|siblings\|core\|cores\|apicid" プロセッサ: 0 物理 ID: 0 兄弟: 4 コア ID: 0 CPU コア: 2 apicid: 0 初期 apicid: 0 プロセッサ: 1 物理 ID: 0 兄弟: 4 コア ID: 0 CPU コア: 2 apicid: 1 初期 apicid: 1 プロセッサ: 2 物理 ID: 0 兄弟: 4 コア ID: 1 CPU コア: 2 apicid: 2 初期 apicid: 2 プロセッサ: 3 物理 ID: 0 兄弟: 4 コア ID: 1 CPU コア: 2 apicid: 3 初期 apicid: 3

FreeBSD では、トポロジは kern.sched.topology_spec 変数の sysctl メカニズムを介して XML として報告されます。

隠しテキスト

user@host:~$ sysctl kern.sched.topology_spec kern.sched.topology_spec: 0, 1, 2, 3, 4, 5, 6, 7 0, 1, 2, 3, 4, 5, 6, 7 0, 1 スレッドグループSMTグループ 2, 3 スレッドグループSMTグループ 4, 5 スレッドグループSMTグループ 6, 7 スレッドグループSMTグループ

MS Windows 8 では、トポロジ情報はタスク マネージャーで確認できます。

新しい千年紀の初期、CPU 周波数がついに 1 GHz のマークを超えたとき、一部の企業 (Intel を指差すのはやめましょう) は、新しい NetBurst アーキテクチャが将来的には約 10 GHz の周波数に達する可能性があると予測しました。 愛好家たちは攻撃を予想していた 新時代、CPUのクロック速度が雨後のキノコのように成長するとき。 さらなるパフォーマンスが必要ですか? より高速なクロックのプロセッサにアップグレードするだけです。

メガヘルツが PC のパフォーマンスを向上し続ける最も簡単な方法であると考えていた夢想家たちの頭に、ニュートンのリンゴが音を立てて落ちました。 物理的な制限により、クロック周波数を指数関数的に増加させると、それに対応して発熱量が増加し、生産技術に関連する他の問題も発生し始めました。 実際、近年、最速のプロセッサは 3 ~ 4 GHz の周波数で動作します。

もちろん、人々が進んでお金を払う場合、進歩を止めることはできません。さらに多くのことを求めるなら、かなりの金額を支払うことをいとわないユーザーが非常に多くいます。 強力なコンピュータ。 したがって、エンジニアは、クロック速度だけに依存するのではなく、特にコマンド実行の効率を高めることによって、パフォーマンスを向上させる他の方法を探し始めました。 並列処理も解決策であることが判明しました。CPU を高速化できない場合は、同じ種類の 2 番目のプロセッサを追加してコンピューティング リソースを増やしてみてはいかがでしょうか。

Pentium EE 840 は、小売店に登場した最初のデュアルコア CPU です。

同時実行性の主な問題は、複数のスレッドに負荷を分散するようにソフトウェアを特別に作成する必要があることです。つまり、頻度とは異なり、すぐに効果が得られるわけではありません。 2005 年に最初のデュアルコア プロセッサが登場したとき、デスクトップ PC にはデュアルコア プロセッサをサポートするソフトウェアがほとんどなかったため、パフォーマンスはあまり向上しませんでした。 実際、シングルコア CPU はより高いクロック速度で実行されるため、ほとんどのデュアルコア CPU はほとんどのタスクでシングルコア CPU よりも低速でした。

しかし、すでに 4 年が経過し、その間に多くの変化がありました。 多くのソフトウェア開発者は、複数のコアを活用できるように製品を最適化しています。 現在、シングルコア プロセッサーは店頭で見つけるのが難しくなり、デュアル、トリプル、クアッドコア CPU が非常に一般的になっています。

しかし、実際に必要な CPU コアの数はいくつあるのでしょうか?という疑問が生じます。 ゲームにはトリプルコアプロセッサで十分ですか? それとも追加料金を払ってクアッドコアチップを購入した方が良いでしょうか? デュアルコア プロセッサは平均的なユーザーにとって十分ですか? それとも、コアの数が増えても実際に違いはありますか? どのアプリケーションがマルチコア向けに最適化されており、周波数やキャッシュ サイズなどの仕様の変更のみに対応するのはどれですか?

僕らはその時が来たと思った 良い時間更新されたパッケージ (ただし、更新はまだ完了していません) のアプリケーションをシングル、デュアル、トリプル、クアッドコア構成でテストして、2009 年にマルチコア プロセッサがどれほど価値があるかを理解します。

公平なテストを保証するために、クアッドコア プロセッサー、つまり 2.7 GHz にオーバークロックされた Intel Core 2 Quad Q6600 を選択しました。 システムでテストを実行した後、コアの 1 つを無効にして再起動し、テストを繰り返しました。 コアを順番に無効にし、アクティブなコアの数 (1 から 4 まで) を変えて結果を取得しましたが、プロセッサーとその周波数は変更しませんでした。

Windows で CPU コアを無効にするのは非常に簡単です。 これを行う方法を知りたい場合は、Windows Vista の「検索の開始」ウィンドウに「msconfig」と入力し、「Enter」を押します。 これにより、システム構成ユーティリティが開きます。

その中で、「ダウンロード/ブート」タブに移動し、「 追加オプション/高度なオプション"。

これにより、「Boot Advanced Options」ウィンドウが表示されます。 [プロセッサの数] チェックボックスを選択し、システムでアクティブになる必要なプロセッサ コアの数を指定します。 すべてはとてもシンプルです。

確認後、プログラムは再起動するように求めます。 マネージャーで再起動した後 Windowsタスク「(タスク マネージャー)」では、アクティブなコアの数を確認できます。「タスク マネージャー」は、Crtl+Shift+Esc キーを押すと呼び出されます。

「タスクマネージャー」の「パフォーマンス」タブを選択します。 その中の「CPU 使用率の履歴」項目で、各プロセッサー/コア (アクティブなハイパースレッディング サポートを備えた Core i7 の場合のように、個別のプロセッサー/コアまたは仮想プロセッサー) の負荷グラフが表示されます。 。 2 つのグラフは、2 つのアクティブ コア、3 ~ 3 つのアクティブ コアなどを意味します。

テストの方法論については理解していただいたところで、テスト コンピューターとプログラムの構成の詳細な検討に移りましょう。

テスト構成

システムハードウェア
CPU Intel Core 2 Quad Q6600 (Kentsfield)、2.7 GHz、FSB-1200、8 MB L2 キャッシュ
プラットホーム MSI P7N SLI プラチナ、Nvidia nForce 750i、BIOS A2
メモリ A-Data EXTREME DDR2 800+、2 x 2048 MB、DDR2-800、CL 5-5-5-18 (1.8 V)
HDD Western Digital Caviar WD50 00AAJS-00YFA、500 GB、7200 rpm、8 MB キャッシュ、SATA 3.0 Gbit/s
ネット 統合された nForce 750i ギガビット イーサネット コントローラー
ビデオカード ギガバイト GV-N250ZL-1GI 1 GB DDR3 PCIe
パワーユニット ウルトラ HE1000X、ATX 2.2、1000 W
ソフトウェアとドライバー
オペレーティング·システム Microsoft Windows Vista Ultimate 64 ビット 6.0.6001、SP1
DirectXのバージョン ダイレクトX10
プラットフォームドライバー nForce ドライバー バージョン 15.25
グラフィックドライバー Nvidia フォースウェア 182.50

テストと設定

3D ゲーム
クライシス 品質設定を最低、オブジェクトの詳細を高、物理演算を非常に高に設定、バージョン 1.2.1、1024x768、ベンチマーク ツール、3 回の平均
レフト フォー デッド 品質設定は最低、1024x768、バージョン 1.0.1.1、時間指定デモに設定されています。
紛争中の世界 品質設定は最低、1024x768、パッチ 1.009、内蔵ベンチマークに設定されています。
iTunes バージョン: 8.1.0.52、オーディオ CD (「ターミネーター II」SE)、53 分、デフォルト形式 AAC
ダサいMP3 バージョン: 3.98 (64 ビット)、オーディオ CD「ターミネーター II」SE、53 分、wave to MP3、160 Kb/s
TMPEG4.6 バージョン:4.6.3.268、インポートファイル:「ターミネーター II」SE DVD(5分)、解像度:720x576(PAL)16:9
ディビジョン6.8.5 エンコードモード: 非常に高い品質、強化されたマルチスレッド、SSE4 を使用して有効、クォーターピクセル検索
XviD 1.2.1 エンコード状態の表示=オフ
主要概念参照 1.6.1 MPEG2 to MPEG2 (H.264)、MainConcept H.264/AVC コーデック、28 秒 HDTV 1920x1080 (MPEG2)、オーディオ: MPEG2 (44.1 KHz、2 チャンネル、16 ビット、224 Kb/s)、モード: PAL (25 FPS)、プロファイル: Tom の Qct-Core 用ハードウェア設定
Autodesk 3D Studio Max 2009 (64 ビット) バージョン: 2009、1920x1080 (HDTV) でのドラゴン画像のレンダリング
アドビフォトショップCS3 バージョン: 10.0x20070321、69 MB TIF 写真からのフィルタリング、ベンチマーク: Tomshardware-Benchmark V1.0.0.4、フィルター: クロスハッチ、ガラス、墨絵、アクセント付きエッジ、角度付きストローク、スプレー ストローク
Grisoft AVG アンチウイルス 8 バージョン: 8.0.134、ウイルスベース: 270.4.5/1533、ベンチマーク: ZIP/RAR 圧縮ファイルの 334 MB フォルダーをスキャン
WinRAR 3.80 バージョン 3.80、ベンチマーク: THG ワークロード (334 MB)
WinZip 12 バージョン 12、圧縮 = 最高、ベンチマーク: THG ワークロード (334 MB)
3DMark ヴァンテージ バージョン: 1.02、GPU および CPU スコア
PCMark Vantage バージョン: 1.00、システム、メモリ、 ハードディスクドライブのベンチマーク、Windows メディアプレーヤー 10.00.00.3646
SiSoftware サンドラ 2009 SP3 CPUテスト=CPU演算/マルチメディア、メモリテスト=帯域幅ベンチマーク

試験結果

合成テストの結果から始めて、それらがどの程度一致しているかを評価しましょう。 実際のテスト。 合成テストは将来を念頭に置いて作成されているため、実際のアプリケーションよりもコア数の変化に敏感である必要があることを覚えておくことが重要です。

まずは 3DMark Vantage の合成ゲーム パフォーマンス テストから始めます。 パフォーマンスを維持するために 3DMark は利用可能な最低解像度で実行される「Entry」実行を選択しました。 CPUが強い結果に影響を与えた。

ほぼ直線的な成長は非常に興味深いです。 最大の増加は 1 コアから 2 コアに移行したときに観察されますが、それでもスケーラビリティは非常に顕著です。 次に、システム全体のパフォーマンスを示すように設計された PCMark Vantage テストに移りましょう。

PCMark の結果によると、エンド ユーザーは CPU コアの数を 3 つに増やすことでメリットが得られ、4 つ目のコアでは逆にパフォーマンスがわずかに低下します。 この結果の原因を見てみましょう。

メモリ サブシステムのテストでも、1 つの CPU コアから 2 つの CPU コアに移行したときにパフォーマンスが最大に向上することがわかりました。

私たちには、生産性テストが PCMark テスト全体の結果に最も大きな影響を与えるように思えます。 この場合パフォーマンスの向上は 3 コアで終了します。 別の合成テストである SiSoft Sandra の結果が類似しているかどうかを見てみましょう。

SiSoft Sandra の算術テストとマルチメディア テストから始めます。


合成テストでは、1 つの CPU コアから 4 つの CPU コアに移行すると、パフォーマンスがかなり直線的に向上することが実証されています。 このテストは、4 つのコアを効率的に使用するために特別に作成されていますが、実際のアプリケーションでも同様の直線的な進行が見られるとは考えていません。

Sandra メモリ テストでは、iSSE2 の整数バッファ操作において 3 つのコアがより多くのメモリ帯域幅を提供することも示唆しています。

総合テストの後は、アプリケーション テストで何が得られるかを確認します。

オーディオ エンコーディングは従来、アプリケーションが複数のコアから大きな恩恵を受けられなかったり、開発者によって最適化されていなかったりする分野でした。 以下はLameとiTunesの結果です。

複数のコアを使用する場合、Lame はあまり利点を示しません。 興味深いことに、コア数が偶数の場合、パフォーマンスがわずかに向上することがわかりますが、これは非常に奇妙です。 ただし、その差は小さいため、誤差の範囲内である可能性があります。

iTunes に関しては、2 つのコアをアクティブ化した後、パフォーマンスがわずかに向上しましたが、それ以上のコアを使用しても何も起こりません。

Lame も iTunes も、オーディオ エンコーディング用の複数の CPU コアに最適化されていないことがわかりました。 一方、私たちが知る限り、ビデオ エンコード プログラムは、その本質的な並列性により、多くの場合、複数のコア向けに高度に最適化されています。 ビデオのエンコード結果を見てみましょう。

MainConcept Reference を使用してビデオ エンコード テストを開始します。

コア数の増加が結果にどの程度影響するかに注目してください。シングルコア 2.7 GHz ではエンコード時間が 9 分から短縮されています。 コアプロセッサ 4 つのコアすべてがアクティブな場合は、2 ~ 2 分 30 秒かかります。 頻繁にビデオをトランスコードする場合は、4 つのコアを備えたプロセッサを使用する方が良いことは明らかです。

TMPGEnc テストでも同様の利点が見られますか?

ここでは、エンコーダーの出力への影響を確認できます。 DivX エンコーダは複数の CPU コア向けに高度に最適化されていますが、Xvid にはそれほど顕著な利点はありません。 ただし、Xvid であっても、1 コアから 2 コアに移行すると、エンコード時間が 25% 短縮されます。

Adobe Photoshop を使用してグラフィック テストを開始しましょう。

ご覧のとおり、CS3 バージョンではカーネルの追加が認識されません。 そのような場合の奇妙な結果 人気番組、使用しなかったことは認めますが、 最新バージョンフォトショップCS4。 CS3 の結果は依然として感動的なものではありません。

Autodesk 3ds Max での 3D レンダリングの結果を見てみましょう。

Autodesk 3ds Max が追加のコアを「気に入っている」ことは明らかです。 この機能は、プログラムが DOS 環境で実行されている場合でも 3ds Max に存在していました。これは、3D レンダリング タスクの完了に非常に時間がかかり、ネットワーク上の複数のコンピュータにタスクを分散する必要があったためです。 繰り返しになりますが、このようなプログラムではクアッドコア プロセッサを使用することが非常に望ましいです。

ほとんどの人がウイルス対策ソフトウェアを使用しているため、ウイルス対策スキャン テストは実際の状況に非常に近いものになります。

AVG アンチウイルスは、CPU コアの増加に伴って素晴らしいパフォーマンスの向上を示します。 ウイルス対策スキャン中はコンピューターのパフォーマンスが大幅に低下する可能性があり、その結果は、複数のコアによってスキャン時間が大幅に短縮されることを明確に示しています。


WinZip と WinRAR は、複数のコアでは顕著な向上をもたらしません。 WinRAR は 2 つのコアでパフォーマンスの向上を示していますが、それ以上の効果はありません。 リリースされたばかりのバージョン 3.90 がどのように動作するかを見るのは興味深いでしょう。

デュアルコア デスクトップが登場し始めた 2005 年には、シングルコア CPU からマルチコア プロセッサに移行したときにパフォーマンスの向上を示したゲームはまったくありませんでした。 しかし時代は変わりました。 複数の CPU コアがどのように影響するか 現代のゲーム? いくつかの人気ゲームを起動して見てみましょう。 グラフィックス カードの影響を最小限に抑え、これらのゲームによって CPU パフォーマンスがどの程度影響を受けるかを判断するために、1024x768 の低解像度および低レベルのグラフィック詳細でゲーム テストを実行しました。

まずはクライシスから始めましょう。 「高」に設定したオブジェクトの詳細と、「非常に高」に設定した物理を除き、すべてのオプションを最小限に抑えました。 その結果、ゲームのパフォーマンスは CPU にさらに依存することになります。

Crysis は CPU コアの数への顕著な依存性を示しました。ビデオ カードのパフォーマンスにより多く反応すると考えていたため、これは非常に驚くべきことでした。 いずれにせよ、Crysis ではシングルコア CPU のフレーム レートが 4 コアの半分であることがわかります (ただし、ゲームがビデオ カードのパフォーマンスに大きく依存する場合、結果のばらつきが異なる数値になることに注意してください) CPU コアの数は小さくなります)。 4 つ目のコアを追加しても目立った違いは生じないため、Crysis は 3 つのコアしか使用できないことに注意するのも興味深いです。

しかし、Crysis が物理計算を真剣に使用していることはわかっているので、それほど高度ではない物理演算を使用するゲームでは状況がどうなるかを見てみましょう。 たとえば、Left 4 Dead です。

興味深いことに、Left 4 Dead も同様の結果を示していますが、パフォーマンス向上の大部分は 2 番目のコアを追加した後に発生します。 3 コアに移行すると若干の増加がありますが、このゲームでは 4 つ目のコアは必要ありません。 興味深い傾向です。 それがリアルタイム ストラテジー World in Conflict にどの程度典型的なものになるかを見てみましょう。

結果も同様ですが、3 つの CPU コアがわずかに影響するという驚くべき特徴が見られます。 よりよい性能 4つよりも。 この差は誤差の範囲に近いですが、これは 4 番目のコアがゲームで使用されていないことを再度裏付けます。

結論を出す時が来ました。 大量のデータを受け取ったので、平均的なパフォーマンスの向上を計算して状況を単純化してみましょう。

まず、複数コアの使用とコアの使用を比較した場合、総合テストの結果は楽観的すぎると言いたいです。 実際のアプリケーション。 1 つのコアから複数のコアに移行した場合の合成テストのパフォーマンスの向上は、ほぼ直線的に見え、新しいコアごとにパフォーマンスが 50% 追加されます。

アプリケーションでは、より現実的な進歩が見られます。2 番目の CPU コアからは約 35% の増加、3 番目の CPU コアからは 15% の増加、4 番目の CPU コアからは 32% の増加です。 3 番目のコアを追加すると、4 番目のコアがもたらすメリットの半分しか得られないのは奇妙です。

ただし、アプリケーションでは、次の点に注意することをお勧めします。 個別プログラム、全体的な結果ではありません。 実際、たとえばオーディオ エンコーディング アプリケーションでは、コア数を増やしてもまったくメリットがありません。 一方、ビデオ エンコード アプリケーションは、使用するエンコーダに大きく依存しますが、CPU コアが増えると大きなメリットが得られます。 3D レンダリング プログラム 3ds Max の場合、マルチコア環境向けに大幅に最適化されており、Photoshop などの 2D 写真編集アプリケーションはコアの数に応答しません。 AVG アンチウイルスはいくつかのコアでパフォーマンスの大幅な向上を示しましたが、ファイル圧縮ユーティリティの向上はそれほど大きくありませんでした。

ゲームに関しては、1 コアから 2 コアに移行するとパフォーマンスが 60% 向上し、システムに 3 つ目のコアを追加すると、さらに 25% の差が生じます。 4 番目のコアは、選択したゲームでは何の利点も提供しません。 もちろん、私たちが取った場合、 他のゲームその場合、状況は変わる可能性がありますが、いずれにせよ、トリプルコア Phenom II X3 プロセッサーは非常に魅力的に見えます。 安価な選択ゲーマー向け。 さらに移動する場合は次の点に注意することが重要です。 高解像度視覚的な詳細を追加すると、グラフィックス カードがフレーム レートの決定要因となるため、コア数による差は小さくなります。


4つのコア。

以上のことを総合すると、さまざまな結論が導き出されます。 全体として、マルチコア CPU のインストールによるメリットを享受するには、いかなるプロフェッショナル ユーザーである必要もありません。 4年前と比べて状況は大きく変わりました。 もちろん、一見したところ、その違いはそれほど重要ではないように見えますが、過去数年間でどれだけのアプリケーションがマルチスレッド用に最適化されたか、特にこの最適化によってパフォーマンスが大幅に向上するプログラムに注目するのは非常に興味深いです。 実際、今日では、低電力ソリューションを除いて、シングルコア CPU を推奨する意味はないと言えます (まだ入手できる場合)。

さらに、アプリケーションによっては、できるだけ多くのコアを備えたプロセッサを購入することがユーザーに推奨される場合があります。 その中には、ビデオ エンコード プログラム、3D レンダリング、およびウイルス対策ソフトウェアを含む最適化された業務アプリケーションに注目します。 ゲーマーにとって、強力なグラフィックス カードを備えたシングルコア プロセッサで十分だった時代は終わりました。

マルチコアを備えた最初のコンピュータ プロセッサは 2000 年代半ばに消費者市場に登場しましたが、多くのユーザーはまだマルチコア プロセッサとは何なのか、またその特性をどのように理解すればよいのかを十分に理解していません。

記事「マルチコアプロセッサの真実」のビデオ形式

「プロセッサーって何?」をわかりやすく解説

マイクロプロセッサは、コンピュータの主要なデバイスの 1 つです。 この無味乾燥な正式名称は、単に「プロセッサー」と短縮されることがよくあります)。 プロセッサはマッチ箱に匹敵する面積を持つ超小型回路です。 プロセッサーは車のエンジンのようなものだと言えます。 最も重要な部分ですが、それだけではありません。 車にはホイール、ボディ、ヘッドライト付きのプレーヤーもあります。 しかし、「マシン」のパワーを決定するのはプロセッサ(車のエンジンなど)です。

多くの人はプロセッサをシステム ユニット、つまりすべての PC コンポーネントが内部に配置されている「箱」と呼んでいますが、これは根本的に間違っています。 システムユニット- これは、コンピュータ ケースとそのすべてのコンポーネント部品 (ハード ドライブ) です。 ラムその他多くの詳細。

プロセッサ機能 - コンピューティング。 どちらであるかはそれほど重要ではありません。 実際のところ、コンピュータでの作業はすべて算術計算のみに基づいています。 加算、乗算、減算、その他の代数はすべて「プロセッサ」と呼ばれる超小型回路によって実行されます。 そして、そのような計算の結果は、ゲーム、Word ファイル、または単なるデスクトップの形式で画面に表示されます。

計算を実行するコンピュータの主要な部分は次のとおりです。 プロセッサーとは何ですか.

プロセッサコアとマルチコアとは何ですか

プロセッサ数世紀の初めから、これらのマイクロ回路はシングルコアでした。 実際、コアはプロセッサ自体です。 そのメインと主要部分。 プロセッサには他の部品、たとえば「脚」接点、微細な「電気配線」もありますが、計算を担当するまさにそのブロックは、 プロセッサコア。 プロセッサーが非常に小型になったとき、エンジニアは 1 つのプロセッサー「ケース」内に複数のコアを組み合わせることにしました。

プロセッサーをアパートとして想像すると、コアはそのようなアパートの大きな部屋になります。 1 ルーム アパートメントは、1 つのプロセッサ コア (大きな部屋 - ホール)、キッチン、バスルーム、廊下です。2 ルーム アパートメントは、他の部屋と合わせて 2 つのプロセッサ コアのようなものです。 3 部屋、4 部屋、さらには 12 部屋のアパートメントもあります。 プロセッサの場合も同様です。1 つの「アパート」クリスタル内に複数の「部屋」コアが存在する場合があります。

マルチコア- これは、1 つのプロセッサを複数の同一の機能ブロックに分割したものです。 ブロック数は、1 つのプロセッサー内のコアの数です。

マルチコアプロセッサの種類

「プロセッサのコア数が多ければ多いほど良い」という誤解があります。 これはまさに、この種の誤解を生み出すことで報酬を得ているマーケティング担当者が、この問題を提示しようとする方法です。 彼らの仕事は、安価なプロセッサを、さらに高価格で大量に販売することです。 しかし実際には、コアの数はそれほど多くありません 主な特徴プロセッサー。

プロセッサーとアパートメントの例えに戻りましょう。 2 ルーム アパートメントは、1 ルーム アパートメントよりも高価で、より快適で、高級です。 ただし、これらのアパートが同じエリアにあり、同じ設備が整っており、リノベーションも同様である場合に限ります。 デュアルコアのものよりも大幅に弱い、弱いクアッドコア (または 6 コア) プロセッサーもあります。 しかし、これを信じるのは難しいでしょう。もちろん、「ある」2 つに対する 4 または 6 という大きな数字の魔法です。 しかし、これはまさに非常に頻繁に起こることです。 同じ 4 部屋のアパートのように見えますが、完全に辺鄙な場所にあり、改築もされていない廃墟状態です。しかも、中心部にある豪華な 2 部屋のアパートの価格ですらあります。

プロセッサー内にはコアが何個ありますか?

のために パソコンシングルコア プロセッサはここ数年適切に生産されておらず、販売されているのを見つけることは非常にまれです。 コア数は2コアからとなります。 4 つのコア - 通常、これらはより高価なプロセッサですが、そこからの利益もあります。 6 コア プロセッサもありますが、これは信じられないほど高価で、実用性はあまり高くありません。 このような巨大なクリスタルのパフォーマンスを向上できるタスクはほとんどありません。

AMDが3コアプロセッサを作成する実験がありましたが、これはすでに過去のことです。 それは非常にうまくいきましたが、彼らの時代は過ぎました。

ところで、 AMD社もマルチコアプロセッサを生産していますが、一般に、インテルの競合他社よりも大幅に性能が劣ります。 確かに、価格ははるかに安いです。 AMD の 4 コアは、ほとんどの場合、Intel の同じ 4 コアよりも著しく弱いことが判明することを知っておく必要があります。

プロセッサには 1、2、3、4、6、12 コアが搭載されていることがわかりました。 シングルコアおよび 12 コアのプロセッサは非常にまれです。 トリプルコアプロセッサは過去のものです。 6 コア プロセッサは、非常に高価であるか (Intel)、または数に見合った金額を支払うほど強力ではない (AMD) かのどちらかです。 2 コアと 4 コアは、最も弱いものから最も強力なものまで、最も一般的で実用的なデバイスです。

マルチコアプロセッサ周波数

コンピュータ プロセッサの特性の 1 つはその周波数です。 同じメガヘルツ (さらに多くの場合はギガヘルツ)。 周波数は重要な特性ですが、唯一の特性ではありません。 はい、おそらく最も重要なことではありません。 たとえば、2 ギガヘルツのデュアルコア プロセッサは、3 ギガヘルツのシングルコア プロセッサよりも強力な製品です。

プロセッサの周波数がコアの周波数とコアの数を掛けたものに等しいと考えるのは完全に間違いです。 簡単に言うと、コア周波数が 2 GHz の 2 コア プロセッサの合計周波数が 4 ギガヘルツに等しくなることはありません。 「共通周波数」という概念さえ存在しません。 この場合、 CPU周波数ちょうど 2 GHz に相当します。 乗算、加算、その他の演算は行われません。

そして再び、プロセッサーをアパートに「変える」ことになります。 各部屋の天井の高さが3メートルの場合、アパート全体の高さは同じままです。同じ3メートルであり、1センチメートルも高くありません。 このようなアパートに部屋がいくつあっても、これらの部屋の高さは変わりません。 また プロセッサコアのクロック速度。 加算したり、乗算したりすることはありません。

仮想マルチコア、またはハイパースレッディング

もあります 仮想プロセッサコア。 Intel プロセッサのハイパー スレッディング テクノロジにより、コンピュータはデュアルコア プロセッサ内に実際に 4 つのコアがあると「認識」します。 唯一無二の方法とよく似ています HDD 論理的にいくつかに分割されるローカルディスク C、D、Eなど。

ハイパースレッド化は、さまざまなタスクに非常に役立つテクノロジです。。 場合によっては、プロセッサコアが半分しか使用されておらず、その構成内の残りのトランジスタがアイドル状態であることが起こります。 エンジニアは、各物理プロセッサ コアを 2 つの「仮想」部分に分割することで、これらの「アイドラー」も機能させる方法を考え出しました。 かなり広い部屋をパーテーションで二つに区切ったような感じです。

これには実際的な意味はありますか? 仮想コアを使ったトリック? ほとんどの場合 - はい、すべては状況によって異なりますが、 特定のタスク。 部屋が増えているように見えますが(そして最も重要なのは、部屋がより合理的に使用されているということです)、部屋の面積は変わっていません。 オフィスでは、このようなパーティションは非常に便利であり、一部の住宅用アパートでも同様です。 他の場合には、部屋を分割する (プロセッサ コアを 2 つの仮想コアに分割する) ことにまったく意味がありません。

最も高価であり、 強力なプロセッサクラスi7は必須装備ハイパーねじ切り。 4 つの物理コアと 8 つの仮想コアがあります。 1 つのプロセッサ上で 8 つの計算スレッドが同時に動作することがわかりました。 安価ですが、 強力なプロセッサインテルクラス i5 4 つのコアで構成されていますが、そこではハイパー スレッディングが機能しません。 Core i5 は 4 スレッドの計算で動作することがわかりました。

プロセッサー i3- 価格とパフォーマンスの両方において典型的な「平均的」。 コアが 2 つあり、ハイパースレッディングの兆候はありません。 合計すると、次のことがわかります i3計算スレッドは 2 つだけです。 率直に言って予算クリスタルにも同じことが当てはまります ペンティアムとセレロン。 2 コア、ハイパースレッディングなし = 2 スレッド。

コンピューターには多くのコアが必要ですか? プロセッサーにはいくつのコアが必要ですか?

最新のプロセッサはすべて、一般的なタスクに十分な能力を備えています。 インターネットの閲覧、ソーシャル ネットワークや電子メールでのやり取り、事務作業 Word-PowerPoint-Excel: 性能の低い Atom、手頃な価格の Celeron および Pentium がこの作業に適しており、より強力な Core i3 は言うまでもなくです。 2つのコア 通常の仕事十二分に。 多数のコアを備えたプロセッサーでは速度は大幅に向上しません。

ゲームの場合はプロセッサに注意する必要がありますi3またはi5。 むしろ、ゲームのパフォーマンスはプロセッサではなくビデオ カードに依存します。 Core i7 のフルパワーを必要とするゲームはほとんどありません。 したがって、ゲームに必要なプロセッサ コアは 4 つまでであり、多くの場合は 2 つのコアが適していると考えられています。

特殊な作業など本格的な作業に エンジニアリングプログラム、ビデオのエンコードやその他のリソースを大量に消費するタスク 本当に生産性の高い設備が必要です。 多くの場合、ここでは物理プロセッサ コアだけでなく仮想プロセッサ コアも使用されます。 コンピューティング スレッドが多ければ多いほど良いのです。 そして、そのようなプロセッサーの価格は問題ではありません。専門家にとって、価格はそれほど重要ではありません。

マルチコアプロセッサには何か利点がありますか?

はいぜったいに。 コンピュータは、少なくとも複数のタスクを同時に処理します。 窓の仕事(ちなみに、これらは何百もの異なるタスクです)そして同時に、映画を再生します。 音楽の再生とインターネットの閲覧。 仕事 テキストエディタそして音楽がオンになりました。 2 つのプロセッサ コア (実際には 2 つのプロセッサ) で次のような問題に対処します。 さまざまなタスク 1つよりも速い。 2 つのコアにより、これが少し速くなります。 4 つは 2 よりもさらに高速です。

マルチコア テクノロジが存在して最初の数年間は、2 つのプロセッサ コアでもすべてのプログラムが動作できるわけではありませんでした。 2014 年までに、大多数のアプリケーションがマルチ コアを理解し、活用できるようになります。 デュアルコア プロセッサーでのタスクの処理速度が 2 倍になることはほとんどありませんが、パフォーマンスはほぼ必ず向上します。

したがって、プログラムは複数のコアを使用できないという根強い通説は古い情報です。 かつてはまさにそのような状況でしたが、今日では状況は劇的に改善されました。 マルチコアの利点は否定できない、それは事実です。

プロセッサーのコア数が少ないほど優れています

「コアが多ければ多いほど良い」という誤った公式を使用してプロセッサーを購入しないでください。 これは間違っています。 まず、4、6、および 8 コアのプロセッサは、対応するデュアルコアのプロセッサよりも大幅に高価です。 大幅な価格上昇は、パフォーマンスの観点から必ずしも正当化されるわけではありません。 たとえば、8 コアのプロセッサが、コア数の少ない CPU よりも 10% しか高速ではないが、価格が 2 倍高いことが判明した場合、そのような購入を正当化するのは困難になります。

第 2 に、プロセッサのコア数が増えるほど、エネルギー消費の点で貪欲になります。 このラップトップがテキスト ファイルの処理やインターネットの閲覧などのみを行う場合、4 コア (8 スレッド) Core i7 を搭載したはるかに高価なラップトップを購入する意味はありません。 デュアルコア (4 スレッド) Core i5 との違いはなく、コンピューティング スレッドが 2 つだけの古典的な Core i3 も、より著名な「同僚」と比べて劣ることはありません。 そして、このようなバッテリーから 強力なラップトップ経済的で要求の少ない Core i3 よりもはるかに動作が少なくなります。

携帯電話やタブレットのマルチコアプロセッサ

1 つのプロセッサ内に複数のコンピューティング コアを搭載する傾向は、モバイル デバイスにも当てはまります。 多数のコアを搭載したスマートフォンやタブレットでは、マイクロプロセッサーの機能をすべて活用することはほとんどありません。 デュアルコアのモバイル コンピューターは、実際にはもう少し高速に動作する場合がありますが、4 コア、さらには 8 コアは、率直に言ってやりすぎです。 バッテリーはまったく異常に消費され、強力なコンピューティング デバイスはアイドル状態のままです。 結論 - 携帯電話、スマートフォン、タブレットのマルチコア プロセッサはマーケティングへのオマージュにすぎず、緊急のニーズではありません。 コンピュータは電話よりも要求の厳しいデバイスです。 実際には 2 つのプロセッサ コアが必要です。 4つでも痛くないよ。 6 と 8 は、通常のタスクやゲームでも過剰です。

マルチコアプロセッサーを選択して失敗しないようにするにはどうすればよいですか?

今日の記事の実践的な部分は 2014 年に関連しています。 今後数年間で何かが大きく変わる可能性は低いでしょう。 ここでは、Intel 製のプロセッサについてのみ説明します。 はい、AMD は優れたソリューションを提供していますが、人気は低く、理解するのがより困難です。

この表は 2012 年から 2014 年のプロセッサに基づいていることに注意してください。 古いサンプルにはさまざまな特性があります。 また、シングルコア Celeron などの珍しい CPU オプションについても言及しませんでした (現在でもそのようなものはありますが、これは市場にはほとんど存在しない特殊なオプションです)。 内部のコアの数だけでプロセッサを選択すべきではありません。他にもプロセッサはあります。 重要な特性。 この表はマルチコア プロセッサの選択を容易にするだけですが、特定のモデル (各クラスに数十のモデルがあります) は、周波数、熱放散、生成、キャッシュなどのパラメータを注意深く理解した後にのみ購入する必要があります。サイズやその他の特徴。

CPU コア数 計算スレッド 代表的なアプリケーション
原子 1-2 1-4 低電力コンピュータとネットブック。 タスク アトムプロセッサ- 最小限のエネルギー消費。 彼らの生産性は最小限です。
セレロン 2 2 デスクトップおよびラップトップ用の最も安価なプロセッサ。 オフィスでの作業には十分な性能ですが、決してゲーミング用のCPUではありません。
ペンティアム 2 2 Intel プロセッサは Celeron と同じくらい安価で低パフォーマンスです。 オフィスコンピュータに最適です。 Pentium にはわずかに大きなキャッシュが搭載されており、Celeron に比べてパフォーマンスがわずかに向上する場合があります。
コアi3 2 4 2 つのかなり強力なコア。それぞれが 2 つの仮想「プロセッサ」(ハイパー スレッディング) に分割されます。 これらは、価格がそれほど高くなくても、すでに非常に強力な CPU です。 良い選択特別なパフォーマンスを要求しない家庭用または強力なオフィス コンピュータに適しています。
コアi5 4 4 本格的な 4 コア Core i5 プロセッサーは非常に高価です。 彼らのパフォーマンスが不足しているのは、最も要求の厳しいタスクだけです。
コアi7 4-6 8-12 最も強力ですが、特に高価な Intel プロセッサ。 原則として、Core i5 より高速になることはほとんどなく、一部のプログラムでのみ発生します。 それらに代わるものはまったくありません。

記事「マルチコアプロセッサに関する真実」の簡単な要約。 メモ代わりに

  • CPUコア- 彼の 成分。 実際、ケース内には独立したプロセッサーが搭載されています。 デュアルコアプロセッサー - 1 つの中に 2 つのプロセッサーを搭載。
  • マルチコアアパートの部屋の数に匹敵します。 2部屋のアパートは1部屋のアパートよりも優れていますが、他の特性(アパートの場所、条件、面積、天井の高さ)が等しい場合に限ります。
  • という声明は、 プロセッサーのコア数が多いほど性能が向上します- マーケティング戦略、完全に間違ったルール。 結局のところ、アパートは部屋の数だけでなく、場所、改装、その他のパラメータによっても選択されます。 プロセッサ内の複数のコアにも同じことが当てはまります。
  • 存在する 「仮想」マルチコア— ハイパースレッディングテクノロジー。 このテクノロジーのおかげで、各「物理」コアは 2 つの「仮想」コアに分割されます。 ハイパー スレッディングを備えた 2 コア プロセッサには実際のコアは 2 つしかありませんが、これらのプロセッサは 4 つの計算スレッドを同時に処理することがわかります。 これは非常に便利な機能ですが、4 スレッド プロセッサをクアッドコア プロセッサとみなすことはできません。
  • Intel デスクトップ プロセッサの場合: Celeron - 2 コアと 2 スレッド。 Pentium - 2 コア、2 スレッド。 Core i3 - 2 コア、4 スレッド。 Core i5 - 4 コア、4 スレッド。 Core i7 - 4 コア、8 スレッド。 ラップトップ (モバイル) CPUインテルコア/スレッドの数が異なります。
  • モバイル コンピューターの場合、多くの場合、コアの数よりもエネルギー効率 (実際にはバッテリー寿命) の方が重要です。

4 コア プロセッサとは何かを知らなければ、この問題を理解することはできません。 シングル、デュアル、トリプルコアのプロセッサでは、すべてがシンプルです。それぞれ、1 つ、2 つ、または 3 つのコアを備えています。 4 コアに関しては、すべてが一見したとおりであるわけではありません。

2コアプロセッサか4コアプロセッサか?

ほとんどの人は、各コアの周波数が合計されると考えると誤解します。 2.5倍 GHz周波数コアは 4 つあり、2.5 * 4 = 10 GHz を意味します。 しかし、そうではありません。周波数は常に同じ 2.5 GHz です。 なぜ周波数が加算されないのでしょうか? 各プロセッサがこの周波数で並列動作するためです。

一部とは、プロセッサがプロセッサに入るすべてのスレッドにリソースを割り当てる計算時間の一部です。 これは、最高速度 60 km/h (2.5 GHz) の高速道路が 4 本あるようなものです。私たちには商品を届けるトラックがあり (これらは私たちのプログラムの一部または一部です)、配信速度 (システムのパフォーマンスの向上) を向上させるには、4 つの高速道路すべてを使用するか、最大速度 (3.0 GHz) を上げる必要があります。 しかし、ほとんどのプログラムでは、複数のスレッドで動作することは不可能です。プログラムは 1 つのスレッドで動作し、使用できるハイウェイは 1 つだけです (つまり、プログラムには総プロセッサ能力の 25% しか割り当てられません)。は順番に (スレッド化して) 実行する必要があり、シーケンスを破るとロジックが壊れ、障害が発生します。 新しいプログラムは、マルチプログラミング、つまり、現在のほとんどのプログラムのように 1 つのスレッドではなく、複数のスレッド (ハイウェイ) で動作する機能を使用しようとしています。 ゲームもほとんどの場合、マルチスレッド向けに最適化されていますが、メインスレッドは通常 1 つのスレッドで実行されます。 ただし、現在は、より簡単かつ迅速にするために、それをいくつかに分割しようとしています。 したがって、通常 1 つまたは 2 つのスレッドで実行されるゲームやアプリケーションの場合は、2 コア プロセッサを使用することをお勧めします。

デュアルコアの周波数がクアッドコアの周波数と同じである場合は、もちろん、クアッドコアを使用する方が良いでしょう。なぜなら、膨大な数のプログラムを同時に実行しているからです。弱い負荷。 他のすべてのプロセスが別のコアにプリエンプトされるため、システムのパフォーマンスが向上します。 フルロードそれらの中の一つ。 ただし、通常、新しいデュアルコアの周波数は、新しいクアッドコアの周波数よりも高くなります。 そのため、ゲームでテストする場合、周波数が低い 4 コアのものよりも、周波数が高い 2 コアの方が有利です。

次にキューについてです。

ここで、シングルコアからデュアルコアに移行すると、コアによる同時処理だけでなく、プロセッサ上の待機とキューイングによって速度が速く向上することを理解しましょう。

シングルコア プロセッサとデュアルコア プロセッサの周波数は同じですが、コンピュータは 2 コアの方が高速に動作します。 ポイントはマルチプログラミングにあり、シングルコアからデュアルコアに移行すると、速度が大幅に向上します。 マルチプログラミングはスレッドで動作します。 たとえば、Windows が実行され、コンピュータ ゲームが実行されている 2 つのスレッドを想像してみましょう。 コアが 1 つある場合、ゲーム (部分) が処理され、次に Windows 作業 (部分) が順番に処理されます。 プロセスはインラインで待機する必要があります。つまり、ゲームの「部分」が処理されるとき、Windows はゲーム処理 (ゲームの一部) が終了するまで待機する必要があります。 2 コアに切り替えると、シングルコアと同じ周波数であっても、キューが 2 分の 1 に削減されるため、コンピューターはより速く処理を開始します。

100 個のアプリケーションの例を使用して詳しく説明します。1 つのコアがある場合、1 つのアプリケーションが処理され、残りの 99 個は順番を待っています。 そして、列が長ければ長いほど、 進行中のアップデート、その後、システムの速度が低下していると感じます。 また、2 つのコアがある場合、キューは半分に分割されます。つまり、一方に 50 個のアプリケーション、もう一方に 50 個のアプリケーションが存在するため、それらの更新がより簡単かつ高速になります。 キューが小さくなり、アプリケーションがより速く更新されることを知っておくことが重要です。

スレッドをテストするには、winrar を実行して大きなファイルを圧縮し、マネージャー (1 つのスレッドに圧縮されます) で使用される CPU リソースの量 (4 コアで 25%、2 コアで 50%) を確認します。 このことから、ゲームがクアッドコア プロセッサ上の 1 スレッドで実行される場合、プロセッサ パワーの 25% が割り当てられ、デュアルコア プロセッサ上の場合は 50% が割り当てられることになります。 ゲームではマルチスレッドが使用されますが、ゲームのメイン スレッドは依然としてプロセッサの 4 分の 1 (クアッドコア プロセッサ) によって処理されます。

すべてが単純化された方法で考慮されました。周波数が高い 2 コアは、より多くの周波数が 1 つのスレッドに割り当てられるため、ゲームに適しており、4 コアは、同時に実行される多数のアプリケーションなどのマルチスレッド データに適しています。 。

2 コア i5 プロセッサには、4 コア プロセッサと同様にシステム動作をシミュレートできるテクノロジが搭載されています。 実際には 2 コアしかありませんが、Windows の場合は 4 コアの動作がシミュレートされます。 4 つのキュー (スレッド) コアごとに 2 つのキュー (スレッド) が順番に処理されます。 各コアは各スレッドの一部を占有します。つまり、クアッドコアにすることができます。