Universidad de Zaragoza
Custodiado por la Biblioteca de la Universidad de Zaragoza
Premis-plugin for CDSInvenio, developed by Miguel Martín
Miguel Martín González
02408nmm 2200000 a 4500
oai:zaguan.unizar.es:9222
2013-05-21
spa
Ortín Obón, Marta
Villarroya Gaudó, María
Suárez Gracia, Darío
Characterization of interconnection networks in CMPs using full-system simulation
http://zaguan.unizar.es/record/9222
Los computadores más recientes incluyen complejos chips compuestos de varios procesadores y una cantidad significativa de memoria cache. La tendencia actual consiste en conectar varios nodos, cada uno de ellos con un procesador y uno o más niveles de cache privada y/o compartida, utilizando una red de interconexión. La importancia de esta red está aumentando a medida que crece el número de nodos que se integran en un chip, ya que pueden aparecer cuellos de botella en la comunicación que reduzcan las prestaciones. Además, la red contribuye en gran medida al consumo de energía y área del chip. En este proyecto, comparamos el comportamiento de tres topologías: el anillo bidireccional, la malla y el toro. El anillo es una topología mínima con bajo coste en energía pero peor rendimiento debido a la mayor latencia de comunicación entre nodos. Por otro lado, el toro tiene mayor número de enlaces entre nodos y ofrece mejores prestaciones. La malla ha sido incluida como una opción intermedia altamente popular. Analizaremos también dos topologías de anillo adicionales que aprovechan la reducida área y complejidad del mismo: una con mayor ancho de banda y otra con routers de menor número de ciclos. Modelamos cuidadosamente todos los componentes del sistema (procesadores, jerarquía de memoria y red de interconexión) utilizando simulación de sistema completo. Ejecutamos aplicaciones reales en arquitecturas con 16 y 64 nodos, incluyendo tanto cargas paralelas como multiprogramadas (ejecución de varias aplicaciones independientes). Demostramos que la topología de la red afecta en gran medida al rendimiento en sistemas con 64 nodos. Con las topologías de anillo, los tiempos de ejecución son mucho mayores debido al aumento del número de saltos que le cuesta a un mensaje atravesar la red. El toro es la topología que ofrece mejor rendimiento, pero la elección más óptima sería la malla si tenemos en cuenta también energía y área. Por otro lado, para chips con 16 nodos, las diferencias en rendimiento son menores y un anillo con routers de 3 cyclos ofrece un tiempo de ejecución aceptable con el menor coste en área y energía. Nuestra aportación más significativa está relacionada con la distribución del tráfico en la red. Vemos que el tráfico no está distribuido uniformemente y que los nodos con mayores tasas de inyección varían con la aplicación. Hasta donde nosotros sabemos, no hay ningún trabajo de investigación previo que destaque este comportamiento.
http://creativecommons.org/licenses/by-nc-sa/3.0
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
application/pdf 2012-09-14
02408nmm 2200000 a 4500 9222
TAZ-TFM-2012-912
spa
Ortín Obón, Marta
Characterization of interconnection networks in CMPs using full-system simulation
Zaragoza
Universidad de Zaragoza
2012
by-nc-sa
Creative Commons
3.0
http://creativecommons.org/licenses/by-nc-sa/3.0/
Texto en inglés
Los computadores más recientes incluyen complejos chips compuestos de varios procesadores y una cantidad significativa de memoria cache. La tendencia actual consiste en conectar varios nodos, cada uno de ellos con un procesador y uno o más niveles de cache privada y/o compartida, utilizando una red de interconexión. La importancia de esta red está aumentando a medida que crece el número de nodos que se integran en un chip, ya que pueden aparecer cuellos de botella en la comunicación que reduzcan las prestaciones. Además, la red contribuye en gran medida al consumo de energía y área del chip. En este proyecto, comparamos el comportamiento de tres topologías: el anillo bidireccional, la malla y el toro. El anillo es una topología mínima con bajo coste en energía pero peor rendimiento debido a la mayor latencia de comunicación entre nodos. Por otro lado, el toro tiene mayor número de enlaces entre nodos y ofrece mejores prestaciones. La malla ha sido incluida como una opción intermedia altamente popular. Analizaremos también dos topologías de anillo adicionales que aprovechan la reducida área y complejidad del mismo: una con mayor ancho de banda y otra con routers de menor número de ciclos. Modelamos cuidadosamente todos los componentes del sistema (procesadores, jerarquía de memoria y red de interconexión) utilizando simulación de sistema completo. Ejecutamos aplicaciones reales en arquitecturas con 16 y 64 nodos, incluyendo tanto cargas paralelas como multiprogramadas (ejecución de varias aplicaciones independientes). Demostramos que la topología de la red afecta en gran medida al rendimiento en sistemas con 64 nodos. Con las topologías de anillo, los tiempos de ejecución son mucho mayores debido al aumento del número de saltos que le cuesta a un mensaje atravesar la red. El toro es la topología que ofrece mejor rendimiento, pero la elección más óptima sería la malla si tenemos en cuenta también energía y área. Por otro lado, para chips con 16 nodos, las diferencias en rendimiento son menores y un anillo con routers de 3 cyclos ofrece un tiempo de ejecución aceptable con el menor coste en área y energía. Nuestra aportación más significativa está relacionada con la distribución del tráfico en la red. Vemos que el tráfico no está distribuido uniformemente y que los nodos con mayores tasas de inyección varían con la aplicación. Hasta donde nosotros sabemos, no hay ningún trabajo de investigación previo que destaque este comportamiento.
Máster en Ingeniería de Sistemas e Informática
Derechos regulados por licencia Creative Commons
arquitectura de computadores
chip multiprocesador
redes de interconexión
topologías
Villarroya Gaudó, María
dir.
Suárez Gracia, Darío
dir.
Universidad de Zaragoza
Informática e Ingeniería de Sistemas
Arquitectura y Tecnología de Computadores
563837@celes.unizar.es
3775471
http://zaguan.unizar.es/TAZ/EINA/2012/9222/TAZ-TFM-2012-912.pdf
Memoria (spa)
oai:zaguan.unizar.es:9222
public
TAZ
TAZ
TFM
EINA
URI
http://zaguan.unizar.es/record/9222
SUPPORTED
0
MD5
http://zaguan.unizar.es/TAZ/EINA/2012/9222/TAZ-TFM-2012-912.md5
4096
image/x.djvu
6
http://djvu.sourceforge.net/abstract.html
DJVU/6
Profile information
Lizardtech Document Express Enterprise
5.1
2011-01-19T11:29:27
URI
http://zaguan.unizar.es/TAZ/EINA/2012/9222/TAZ-TFM-2012-912.pdf
disk
Minimum
View
Print
Visualization of DJVU requires specific software, like DjVu Browser Plugin
URI
http://creativecommons.org/licenses/by-nc/3.0
URI
http://creativecommons.org/licenses/by-nc/3.0
license
URI
http://creativecommons.org/licenses/by-nc/3.0
You are free to adapt, copy, transmite or distribute the work under the following conditions:
(1) You must attribute the work in the manner specified by the author or licensor (but not in any way that suggests that they endorse you or your use of the work).
(2) You may not use this work for commercial purposes
(3) For any reuse or distribution, you must make clear to others the license terms of this work
(4) Any of the above conditions can be waived if you get permission from the copyright holder
(5) Nothing in this license impairs or restricts the author's moral rights
This object is licensed under Creative Common Attribution-NonCommercial 3.0 (further details: http://creativecommons.org/licenses/by-nc/3.0/).
Universidad de Zaragoza
Automatizacion de Bibliotecas
Edif. Matematicas, Pedro Cerbuna 12, 50009 Zaragoza
auto.buz@unizar.es