Informe de prueba a escala para repositorios de documentos de escala muy grande

Documentos relacionados
WINDOWS : COPIAS DE SEGURIDAD

Windows Server 2012: Infraestructura de Escritorio Virtual

INSTALACIÓ N A3ERP. Informática para empresas INTRODUCCIÓN CONSIDERACIONES GENERALES DE LA INSTALACIÓN PAQUETES DE INSTALACIÓN PREDEFINIDOS

INSTALACIÓN A3ERP INTRODUCCIÓN CONSIDERACIONES GENERALES DE LA INSTALACIÓN PAQUETES DE INSTALACIÓN PREDEFINIDOS

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.

Descripción. Este Software cumple los siguientes hitos:

Unidad de disco duro frente a Kingston SSDNow V+ 200 Series 240GB: prueba comparativa...1

CAPITULO 9. Diseño de una Base de Datos Relacional Distribuida

Componentes de Integración entre Plataformas Información Detallada

Mi primer servidor. Fernando Fernández Consultor Preventa HP ISS

Manual de Instalación. Sistema FECU S.A.

Guía de instalación de la carpeta Datos de IslaWin


Windows Server 2012: Identidad y Acceso. Módulo 2: Descripción General de Windows Server 2012 Remote Desktop Services.

CAPITULO 8. Planeamiento, Arquitectura e Implementación

Guía Rápida de Inicio

Microsoft Dynamics. Migración de FRx 6.7 a Management Reporter for Microsoft Dynamics ERP

Introducción a las redes de computadores

Autor: Microsoft Licencia: Cita Fuente: Ayuda de Windows

IV. Implantación del sistema.

Infraestructura Tecnológica. Sesión 8: Configurar y administrar almacenamiento virtual

COMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX

Guía de selección de hardware Windows MultiPoint Server 2010

INTRODUCCIÓN A LA PROGRAMACIÓN WEB UNIDAD. Estructura de contenidos: cisvirtual@ucv.edu.pe. 1.

Workflows? Sí, cuántos quiere?

LLEVE SU NEGOCIO al SIGUIENTE NIVEL. digitalice todos sus documentos y procesos.

Guía de instalación de la carpeta Datos de ContaWin

Internet Information Server

WINDOWS : TERMINAL SERVER

FileMaker Pro 13. Uso de una Conexión a Escritorio remoto con FileMaker Pro 13

Soporte y mantenimiento de base de datos y aplicativos

Programa de Ayuda EMCS Instalación Versión SQL Server Versión Marzo 2010

FileMaker Pro 14. Uso de una Conexión a Escritorio remoto con FileMaker Pro 14

Solución: Descargar e instalarse el componente desde la página Web de Microsoft:

REQUERIMIENTOS DE HARDWARE Y SOFTWARE INTRODUCCIÓN PLATAFORMA

Toda base de datos relacional se basa en dos objetos

Autenticación Centralizada

Almacenamiento virtual de sitios web HOSTS VIRTUALES

Acronis License Server. Guía del usuario

Microsoft Dynamics. Instalación de Management Reporter for Microsoft Dynamics ERP

Capítulo VI. Estudio de Caso de Aplicación del Integrador de Información Desarrollado

Planificación en Team Foundation Server 2010

Visión General de GXportal. Última actualización: 2009

Implantar Microsoft Software Updates Service (SUS)

Instalación de Crystal Reports

MANUAL COPIAS DE SEGURIDAD

Guía de Apoyo Project Web Access. (Jefe de Proyectos)

Symantec Desktop and Laptop Option

Configuracion Escritorio Remoto Windows 2003

Guía de instalación de Citrix EdgeSight for Load Testing. Citrix EdgeSight for Load Testing 3.6

Práctica No. 1. Consulta de las versiones del SO

Familia de Windows Server 2003

LABORATORIO 10. ADMINISTRACIÓN DE COPIAS DE SEGURIDAD EN SQL SERVER

DataCycle MyVision. La solución web para publicación y ejecución de informes de DataCycle Reporting. Guía de instalación. Versión 8.

Dispositivos de Red Hub Switch

MANUAL DE INSTALACIÓN

Soluciones innovadoras para optimizar su infraestructura TI. Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM

Sistemas de Información. Junio de 2015

Instrucciones de instalación de IBM SPSS Modeler Server 16 para Windows

CAPÍTULO 3 VISUAL BASIC

INSTITUTO TECNOLÓGICO DE COLIMA LIC. EN INFORMÁTICA

Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA

Redes de Altas Prestaciones

App para realizar consultas al Sistema de Información Estadística de Castilla y León

Entidad Formadora: Plan Local De Formación Convocatoria 2010

INSTALACIÓN DE SQL SERVER 2008 Y SQL SERVER 2008 EXPRESS

Motores de Búsqueda Web Tarea Tema 2

CAPÍTULO 3: Resultados

MANUAL DE USUARIO PARA LA INSTALACION DE LOS AGENTES COMMVAULT SIMPANA 9.0

Microsoft SQL Server Conceptos.

SEPARAR Y ADJUNTAR UNA BASE DE DATOS. Separar una base de datos

Novedades en Q-flow 3.02

Instalar protocolo, cliente o servicio nuevo. Seleccionar ubicación de red. Práctica - Compartir y conectar una carpeta

CONCLUISIONES Y RECOMENDACIONES

Windows Server 2012: Infraestructura de Escritorio Virtual

Guía de instalación de Citrix EdgeSight for Load Testing. Citrix EdgeSight for Load Testing 3.7

ÍNDICE SISTEMAS OPERATIVOS... 5

WINDOWS : SERVIDOR DHCP

Plataforma de expediente

Trabaja los Sistemas Aspel desde tus sucursales con Terminal Server

REDES DE ÁREA LOCAL. APLICACIONES Y SERVICIOS EN WINDOWS

CONCURSO COES N 05 / 2014

MANUAL DE INSTALACIÓN PLATAFORMA PROGRESA AUTOR: ASAC COMUNICACIONES DEPARTAMENTO DE DESARROLLO NOVIEMBRE DE 2007

CONCEPTOS BASICOS. Febrero 2003 Página - 1/10

Creación y administración de grupos locales


Guía de inicio rápido a

Guía Rápida de Puesta en Marcha de MailStore

SBConta.NET Manual de instalación. SBSS Consulting, S.A Barcelona Telf , fax web

Redes de área local: Aplicaciones y servicios WINDOWS

Studium, Campus Virtual de la Universidad de Salamanca.

Actualización de versión a Bizagi 10.x

Evaluación de la Plataforma de Almacenamiento de Información de Múltiples Protocolos Celerra NS20 de EMC

Instalación y configuración de Windows SharePoint Services (WSS) 2003

DIAGNOSTICO SERVIDOR Y PLATAFORMA MOODLE

Archivo de correo con Microsoft Outlook contra Exchange Server

Capítulo 5. Cliente-Servidor.

COMBINAR CORRESPONDENCIA EN MICROSOFT WORD

Tema: INSTALACIÓN Y PARTICIONAMIENTO DE DISCOS DUROS.

Instalación del Software Magaya

Transcripción:

Informe de prueba a escala para repositorios de documentos de escala muy grande Este documento se proporciona tal cual. Es posible que la información y los puntos de vista reflejados en este documento, incluidas la dirección URL y otras referencias a sitios web de Internet, cambien sin previo aviso. El usuario asume el riesgo de su uso. Algunos ejemplos descritos en este documento se proporcionan únicamente con fines ilustrativos y son ficticios. No se pretende establecer ni se debe inferir ninguna asociación o conexión reales. Este documento no proporciona derecho legal alguno sobre ninguna propiedad intelectual de ningún producto de Microsoft. Este documento puede copiarse y usarse para fines internos y de referencia. 2011 Microsoft Corporation. Todos los derechos reservados. 1

Informe de prueba a escala para repositorios de documentos de escala muy grande Paul Andrew, Paul Learning, Barry Waldbaum, Frank Marasco Microsoft Corporation Octubre de 2011 Se aplica a: Microsoft SharePoint Server 2010, Microsoft FAST Search Server 2010 for SharePoint. Resumen Estas notas del producto proporcionan detalles sobre una prueba de laboratorio ejecutada en Microsoft para mostrar bases de datos de contenido de SharePoint Server 2010 a gran escala. Incluye información sobre cómo se rellenaron dos bases de datos de contenido de SharePoint Server con un total de 120 millones de documentos que ocupaban 30 terabytes (TB) en bases de datos de SQL Server. Explica detalladamente cómo se indizó este contenido mediante FAST Search Server 2010 for SharePoint. Asimismo, describe la prueba de carga que se realizó en SharePoint Server y FAST Search Server 2010 for SharePoint y muestra los resultados de dicha prueba, así como los resultados de la misma. 2

Contenido Introducción... 5 Objetivos de la prueba... 5 Asociados de hardware que participan... 5 Definición de la carga de trabajo probada... 6 Descripción de la arquitectura de escala horizontal del archivo de documentos... 7 Transacciones de prueba que se incluyeron... 7 Definiciones de las transacciones de la prueba y configuraciones de línea base... 8 Combinación de pruebas de línea base... 9 Series de pruebas... 9 Carga de prueba... 11 Captura de recursos durante las pruebas... 12 Detalles de la arquitectura del hardware de la granja de prueba... 12 Servidores virtuales... 15 Almacenamiento en disco... 16 Arquitectura de la granja de prueba de SharePoint Server y SQL Server... 18 Sitios web de IIS de la granja de SharePoint... 19 Bases de datos de SQL Server... 19 Índices de contenido de FAST Search Server 2010 for SharePoint... 21 El método, la escala de tiempo del proyecto y el proceso de creación de la granja... 21 Escala de tiempo del proyecto... 21 Modo de creación de los documentos de muestra... 22 Características de rendimiento para la carga de documentos a gran escala... 22 Operaciones de entrada-salida por segundo (IOPS)... 24 Rastreo de documentos de FAST Search Server 2010 for SharePoint... 26 Resultados de las pruebas... 27 Serie de pruebas A: variación de usuarios... 27 Serie de pruebas B: variación de de SQL Server... 30 Serie de pruebas C: variación de la combinación de transacciones... 33 Serie de pruebas D: variación de de servidores web front-end... 36 Serie de pruebas E: variación del número de servidores web front-end... 39 Serie de pruebas F: variación de CPU de SQL Server... 43 Prueba del Service Pack 1 (SP1) y la actualización acumulada (CU) de junio... 46 Copias de seguridad de BD de contenido de SQL Server... 47 3

Conclusiones... 47 Recomendaciones... 47 Recomendaciones relacionadas con SQL Server 2008 R2... 47 Recomendaciones relacionadas con SharePoint Server 2010... 48 Recomendaciones relacionadas con FAST Search Server for SharePoint 2010... 48 Referencias... 49 4

Introducción Objetivos de la prueba Estas notas del producto describen los resultados de una prueba a gran escala de SharePoint Server, realizada por Microsoft en junio de 2011. El objetivo de la prueba era publicar los requisitos para el ajuste de escala de los repositorios de archivos de documentos en SharePoint Server a una capacidad de gran almacenaje. La prueba involucraba la creación de un gran número de documentos habituales con un tamaño promedio de 256 KB, la carga de los mismos en una granja de SharePoint, la creación de un índice de FAST Search Server 2010 for SharePoint en los documentos y la ejecución de pruebas con Microsoft Visual Studio 2010 Ultimate para simular la utilización. Con esta prueba queríamos demostrar tanto las técnicas de escala vertical como las de escala horizontal. La escala vertical hace referencia a la capacidad adicional de hardware para aumentar los recursos y escalar un solo entorno que, para nuestro objetivo, es una base de datos de contenido de SharePoint. Una base de datos de contenido de SharePoint incluye todas las colecciones de sitios, todos los metadatos y los objetos binarios grandes (BLOBs) asociados con las colecciones de sitios a los que accede SharePoint Server. La escala horizontal hace referencia a tener varios entornos, lo que para nosotros se traduce en tener varias bases de datos de contenido de SharePoint. Tenga en cuenta que una base de datos de contenido no es solo una base de datos de SQL Server, sino también diferentes datos de configuración y cualquier BLOB de documento, independientemente de su ubicación. La carga de trabajo que probamos para este informe se basa principalmente en archivos de documentos. Se incluye un gran número de documentos típicos de Microsoft Office que se almacenan con fines de archivado. En ese escenario, el almacenamiento suele ser a largo plazo y no se suele acceder a él con frecuencia. Asociados de hardware que participan Esta prueba ha sido posible gracias al apoyo de varios asociados de hardware de Microsoft. NEC Corporation of America NEC proporcionó un servidor NEC Express5800/A1080a (GX) con 8 CPU (procesadores) y 1 terabyte (TB) de total. Cada procesador contenía 8 núcleos, con un total de 64 núcleos en el servidor. Como se detalla más adelante, este servidor se utilizó para ejecutar Microsoft Hyper-V con un número de máquinas virtuales que componían las granjas de SharePoint Server y FAST Search Server 2010 for SharePoint. Ilustración 1: NEC Express Server 5800 5

Origen: www.necam.com/servers/enterprise Especificaciones del servidor NEC Express 5800/A1080a 8 CPU Westmere (E7-8870) con 10 núcleos de procesador 1TB de memoria. Cada módulo de memoria de procesador tiene una CPU (10 núcleos) y 16 DIMM. 2 puertos dobles 8G FC HBA 5 HDD Intel Intel proporcionó un segundo servidor NEC Express5800/A1080a también con 8 CPU (procesadores) y 1 terabyte (TB) de. Intel también actualizó dicho equipo con CPU Westmere EX CPU, con 10 núcleos cada uno, con un total de 80 núcleos en el servidor. Como se detalla más adelante, este servidor se utilizó para ejecutar indizadores de Microsoft SQL Server y FAST Search Server 2010 for SharePoint directamente en el equipo sin utilizar Hyper-V. EMC EMC proporcionó un SAN EMC VNX 5700 con 300 TB de disco de alto rendimiento. Almacenamiento unificado EMC VNX5700 Origen: http://www.emc.com/collateral/software/15-min-guide/h8527-vnx-virt-msapp-t10.pdf Especificaciones de EMC VNX 5700: Unidades de 2 TB, 15 por 3U DAE, 5 unidades = un total de 75 unidades, 150 TB de almacenamiento sin formato Unidades de 600 GB, 25 por 2U DAE, 10 unidades = un total de 250 unidades, 150 TB de almacenamiento sin formato 2 procesadores de almacenamiento 2 unidades de batería de respaldo Definición de la carga de trabajo probada Esta prueba de carga estaba diseñada para mostrar la gran capacidad de archivo de documentos de SharePoint Server 2010. La carga de trabajo del archivo de documentos se caracteriza por tener un gran número de documentos que se agregan (o introducen) paulatinamente, a los que se accede con poca frecuencia y que casi nunca se actualizan. 6

Índice de FAST Search Documentos Biblioteca de documentos Drop Box Enrutamiento de contenido Base(s) de datos de contenido archivado Ilustración 2: trabajo con grandes archivos de documentos Descripción de la arquitectura de escala horizontal del archivo de documentos Se recomienda el enrutamiento de contenido para las granjas de SharePoint con varias bases de datos de contenido, para poder enviar documentos a la base de datos correcta desde la biblioteca de colocación inicial. En las pruebas descritas en este informe, no se configuró el enrutamiento de contenido y nos centramos en la escalabilidad y el rendimiento de la instalación. Aunque se utiliza el enrutamiento de contenido para introducir documentos en una de las varias bases de datos de contenido de SharePoint, FAST Search Server 2010 for SharePoint puede utilizarse para ubicar de forma óptima un documento en una o varias bases de datos de contenido. FAST Search Server 2010 for SharePoint compila un índice con todos los documentos de todas las bases de datos de contenido, y las búsquedas pueden utilizar metadatos y refinadores para seleccionar la fecha, el autor u otras propiedades, y realizar una búsqueda en el texto completo. Transacciones de prueba que se incluyeron Estas notas del producto incluyen los resultados de una serie de pruebas de rendimiento que se llevaron a cabo en SharePoint Server 2010 y FAST Search Server 2010 for SharePoint, en un escenario de archivo de documentos. Esta sección incluye una explicación sobre la metodología que se utilizó para las pruebas que se mencionan en estas notas. Al presentar los datos se mencionan las desviaciones de esta tecnología. Carga de trabajo Importante: Es importante tener en cuenta que las cifras de capacidad y rendimiento específicas presentadas en este artículo serán diferentes de las cifras en entornos reales. Las cifras que se presentan están diseñadas para proporcionar un punto de partida para el diseño de un entorno a una escala adecuada. Después de completar el diseño inicial del sistema, pruebe la configuración para determinar si el sistema admitirá los factores del entorno. Las cargas de trabajo de prueba se diseñaron de acuerdo con un escenario de un gran almacén de archivo de documentos y están dirigidas para desarrollar cálculos estimados sobre qué efecto tiene un escenario de repositorio de documentos a gran escala en las diferentes configuraciones de granja. 7

La granja de prueba representada en este escenario se diseñó para permitir tanto la escala horizontal como la vertical para acomodar capacidad adicional, según sea necesario. La habilidad de escalar es tan crítica para las implementaciones a pequeña escala como para los escenarios de archivos de documentos a gran escala. La escala horizontal le permite agregar más servidores a la granja (o granjas), como servidores web front-end adicionales o servidores de aplicaciones. La escala vertical le permite aumentar la capacidad de los servidores existentes agregando memoria y/o CPU más rápidas para aumentar la capacidad de proceso y el rendimiento. También debería sacarse provecho del enrutamiento de contenido en escenarios de archivos para permitir a los usuarios simplemente "colocar" un documento y hacer que se enrute de forma dinámica a la biblioteca o carpeta correspondiente, si procede, en función de los metadatos del documento. Definiciones de las transacciones de la prueba y configuraciones de línea base En esta sección se definen las transacciones de prueba y otras configuraciones de línea base, y se proporciona información general sobre el proceso de prueba que se usó para cada escenario. En cada sección de resultados de las pruebas, más adelante en estas notas del producto, se proporciona información detallada, como los resultados de las pruebas y parámetros específicos. Elemento de línea base Descripción del elemento de línea base Configuración de línea base (o porcentaje de transacción) Carga de documentos Descarga de documentos (Abrir) Examinar Buscar Tiempo de reflexión Usuario simultáneos Cargar un documento a uno de los centros de documentación. Se creó una carpeta y un archivo únicos en cada Centro de documentación cada hora, 24 horas al día. 1% Descargar o abrir un documento 30% Acceso aleatorio a una página principal del centro de documentación, una página de vista de lista de la biblioteca de documentos, o una página de vista de lista de una carpeta. Una consulta de búsqueda aleatoria enviada al Centro de búsqueda FAST. EL tiempo transcurrido entre transacciones para cada usuario. Esto representa el tiempo que el usuario pasa leyendo o pensando entre los diferentes accesos a las páginas web. El número de usuarios que se conecta a la granja de SharePoint desde los agentes de pruebas a los servidores web front-end de SharePoint. Esto no representa una base total de usuarios, debido a que en un entorno habitual, solo una pequeña proporción del total de los usuario accederá al sistema. 40% 30% 10 segundos 10.000 Duración de la prueba La duración de ejecución de la prueba 1 hora 8

Almacenamiento en caché de web Indización de contenido de FAST Número de servidores web front-end Rampa de usuarios Agentes de pruebas Indica si el almacenamiento en caché de web está activado para los servidores web front-end indica si la indización de contenido de FAST está funcionando durante la prueba El número de servidores web front-end de la granja de SharePoint que se utilizaron durante el test Cada prueba comenzó con 1.000 usuarios y el número aumentó hacia la carga de usuarios objetivo en incrementos de 100 usuarios. Se utilizó un tiempo de rampa de 30 segundos y un tiempo de paso de 10 segundos. Se utilizó Visual Studio 2010 Ultimate para simular la carga de transacciones de usuario. Se utilizó una máquina virtual de controlador de pruebas y 19 máquinas virtuales de agentes de pruebas para crear esta carga. Tabla 1: transacciones de la prueba y configuraciones de línea base Activado Pausada 3 por cada base de datos de contenido 100 usuarios cada 30 segundos 19 Combinación de pruebas de línea base Esta sección define las combinaciones de pruebas que se aprovecharon y proporciona información general de los resultados de las pruebas para cada escenario de combinación de pruebas. La combinación de pruebas que se utilizó para cada prueba varió, en función de los objetivos particulares de las pruebas y cargas. Todas las pruebas de llevaron a cabo mediante Visual Studio 2010 Ultimate y se utilizaron scripts registrados sin código que se generaron exclusivamente con Visual Studio. Se rellenaron puntos de datos específicos para cada prueba y, a continuación, se ejecutó la combinación de pruebas durante diferentes periodos con diferentes números de usuarios simultáneos, para determinar las capacidades y los límites de las granjas. Notas Todas las pruebas llevadas a cabo en el laboratorio se ejecutaron con un "tiempo de reflexión" de 10 segundos. El tiempo de reflexión es una característica del controlador de pruebas de Microsoft Visual Studio 2010 Ultimate que le permite simular el tiempo que los usuarios se pausan entre clics en una página en un entorno real. La combinación de operaciones utilizada para medir el rendimiento para el objetivo de estas notas del producto es artificial. Todos los resultados tienen el propósito de ilustrar las características de rendimiento en un entorno controlado bajo un conjunto de condiciones específicas. Estas combinaciones de pruebas están compuestas de una cantidad inusitada de consultas de lista que consumen una gran cantidad de recursos de SQL Server, frente a otras operaciones. El propósito de lo anterior era proporcionar un punto de partida para el diseño de un entorno a una escala adecuada. Después de completar el diseño inicial del sistema, pruebe la configuración para determinar si variarán las variables específicas del entorno y la combinación de operaciones. Series de pruebas Se ejecutaron seis series de pruebas, etiquetados de la A a la F. Cada serie involucraba la ejecución de una prueba de línea base con idénticos parámetros y entorno, excepto un parámetro, que se variaba. Las pruebas individuales de cada 9

serie se etiquetaban después de la serie de pruebas, seguidas de un número. Esta sección explica las series de pruebas individuales que se ejecutaron. Hay una nota en la lista de pruebas que indica qué test era igual a la línea base. Dicho de otro modo, una de las pruebas de cada serie no variaba en el parámetro elegido, sino que en realidad era idéntica en todos los aspectos a la prueba de línea de base original. Serie de pruebas A: variación de usuarios En esta serie de pruebas se varía el número de usuario para comprobar de qué manera afecta el aumento de la carga de usuario a los recursos de sistema en la granja de SharePoint y FAST Search Server 2010 for SharePoint. Se realizaron tres pruebas que incluían 4.000 usuarios, 10.000 usuarios y 15.000 usuarios. Para la prueba de 15.000 usuarios fue necesario aumentar el tiempo de prueba a 2 horas para gestionar la rampa de usuarios aumentada, y también se aumentaron los servidores web front-end (WFE) a 6 WFE, para poder manejar la carga aumentada. Prueba Número de usuarios Número de WFE Tiempo de prueba A.1 4.000 3 1 hora A.2 10.000 3 1 hora (línea de base) A.3 15.000 6 2 horas Serie de pruebas B: variación de de SQL Server En esta serie de pruebas se varía la cantidad de para Microsoft SQL Server. Debido a que el equipo de SQL Server disponía de una gran cantidad de memoria, ejecutamos esta serie de pruebas para comprobar cuál sería, en comparación, el rendimiento de un servidor que ejecuta SQL Server con menos. Se realizaron seis pruebas con la memoria máxima de de SQL Server establecida en: 16 GB, 32 GB, 64 GB, 128 GB, 256 GB y 600 GB. Prueba de SQL B.1 16 GB B.2 32 GB B.3 64 GB B.4 128 GB B.5 256 GB B.6 600 GB (línea base) Serie de pruebas C: variación de la combinación de búsquedas En esta serie de pruebas se varía la proporción de búsquedas realizadas por los usuarios de prueba, frente a cuando examinan o abren documentos. Esta carga de trabajo aplicada a la granja es una mezcla de diferentes transacciones de usuario, que siguen la línea base de 30 %, 40 % y 30 % para Abrir, Examinar y Buscar, respectivamente. En las pruebas de esta serie se varía la proporción de cada búsqueda y, por lo tanto, también se cambia la proporción de Abrir y Examinar. Prueba Abrir Examinar Buscar C.1 30% 55% 15% C.2 30% 40% 30 % (línea base) C.3 20% 40% 40% C.4 20% 30% 50% C.5 25% 25% 50% C.6 5% 20% 75% 10

Serie de pruebas D: variación de de WFE En esta serie de pruebas se varía la cantidad de asignada a los servidores web front-end. Además, para esta prueba se utilizaron cuatro servidores web front-end. La memoria de cada uno de los 4 servidores web front-end se probó con 4 GB, 6 GB, 8 GB y 16 GB. Prueba Memoria en WFE D.1 4 GB D.2 6 GB D.3 8 GB (línea base) D.4 16 GB Serie de pruebas E: variación del número de WFE En esta serie de pruebas se varía el número de servidores web front-end que se utilizan. Los diferentes números de servidores que se probaron fueron 2, 3, 4, 5 y 6. Prueba Número de WFE E.1 2 E.2 3 (línea base) E.3 4 E.4 5 E.5 6 Serie de pruebas F: restricciones de CPU de SQL Server En esta serie de pruebas se restringe el número de CPU s para Microsoft SQL Server. Los diferentes números de CPU s para SQL Server que se probaron fueron 2, 4, 8 16 y 80 CPU. Prueba CPU para SQL Server F.1 4 F.2 6 F.3 8 F.4 16 F.5 80 (línea base) Carga de prueba Las pruebas tenían el propósito de mantenerse debajo de un punto de carga óptimo, o zona verde, mediante una mezcla general de operaciones. Para medir los cambios concretos, las pruebas se llevaron a cabo en todos los puntos en los que se alteró una variable. Las series de pruebas estaban diseñadas para superar el punto de carga óptimo, para encontrar recursos de cuello de botella en la configuración de la granja. Se recomienda utilizar los resultados del punto de carga óptimo para las granjas de producción de aprovisionamiento, para que haya un exceso de capacidad de recursos para gestionar cargas transitorias o inesperadas. En este proyecto, definimos el punto de carga óptimo al mantener los recursos por debajo de las siguientes mediciones: Latencia del percentil 75 inferior a 1 segundo CPU del servidor web front-end inferior al 85 % CPU de SQL Server inferior al 50 % CPU del servidor de aplicaciones inferior al 50 % CPU de FAST Search Server 2010 for SharePoint inferior al 50 % La tasa de errores es inferior al 0,01 11

Captura de recursos durante las pruebas Durante cada ejecución de prueba, se capturó la utilización de recursos mediante Performance Monitor (Perfmon.exe) y Visual Studio 2010 Ultimate para determinar la carga de la granja de prueba. Se capturaron los siguientes detalles y se muestran en la sección de informes. La CPU para cada WFE, servidor de aplicaciones de SharePoint, índice de FAST Search Server 2010 for SharePoint, aplicación del servicio de Fast Search (SSA) y equipo de SQL Server Utilización de para cada WFE, servidor de aplicaciones de SharePoint, índice de FAST Search Server 2010 for SharePoint, SSA de Fast y equipo de SQL Server Tiempo de actualización de páginas en todos los elementos de prueba Colas de disco por cada unidad Detalles de la arquitectura del hardware de la granja de prueba La granja del Centro de documentación es el host de la administración central de SharePoint, Centro de documentación 1, Centro de documentación 2, Aplicaciones de servicio y el Centro de búsqueda FAST. La granja consiste en tres servidores físicos y 22 virtuales. La Ilustración 3 muestra un diagrama de la arquitectura física. 12

Ilustración 3: diagrama de la arquitectura del hardware 13

Document Center Farm FC HBA (8GB) VNX5700 PACNEC02 (Hyper-V-HOST) Physical 64xLP 1TB Hosting Hyper-V, FAST Admin SPDC01 Physical 4xLP 4GB Domain Controller, DNS Data/Storage FC HBA (8GB) EMC SAN 2 FC HBA (8GB) VNX5700 PACNEC01 (SQL-HOST) Physical 80xLP (Westmere) 1TB Hosting SQL Server, FAST Document Processors Ilustración 4: servidores físicos Se deshabilitó el hyper-threading en los servidores físicos porque no necesitábamos núcleos de CPU adicionales y estábamos limitados a 4 CPU lógicas en cualquier máquina virtual Hyper-V. No queríamos que disminuyera el rendimiento de estos servidores debido al hyper-threading. Había tres servidores físicos en el laboratorio. Los tres servidores físicos más los 22 servidores virtuales se conectaron a una LAN virtual dentro del laboratorio para aislar su tráfico de red de otras máquinas de laboratorio no relacionadas. La LAN estaba hospedada por un conmutador de Ethernet de 1 GBPS, y cada uno de los servidores NEC estaba conectado a dos puertos Ethernet de 1 GBPS. SPDC01. El Controlador de dominio de Windows y el Sistema de nombre de dominios (DNS) para la red virtual utilizada en el laboratorio. o 4 núcleos de procesadores físicos funcionando a 3,4 GHz o 4 GB de o Dispositivo de disco local RAID SCSI de 33 GB PACNEC01. SQL Server 2008 R2 hospeda los archivos primarios y secundarios para las bases de datos de contenido, los registros y TempDB. También se ejecutaron 100 procesadores de documentos FAST en este servidor. o NEC ExpressServer 5800 1080a o 8 CPU de Intel E7-8870 con 80 núcleos de procesadores físicos, funcionando a 2,4 GHz o 1 TB de o 800 GB de disco conectado directamente o 2 tarjetas de adaptación de bus host de canal de fibra de puertos dobles, con capacidad de 8 GB/s o 2 tarjetas de Ethernet de 1 GBPS 14

PACNEC02. Host de Hyper-V que sirve a las máquinas de SharePoint, FAST Search for SharePoint y la plataforma de pruebas dentro de la granja. o NEC ExpressServer 5800 1080a o 8 CPU de Intel X7560 con un total de 64 núcleos de procesadores físicos, funcionando a 2,27 GHz o 1 TB de o 800 GB de disco conectado directamente o 2 tarjetas de adaptación de bus host de canal de fibra de puertos dobles, con capacidad de 8 GB/s o 2 tarjetas de Ethernet de 1 GBPS Servidores virtuales Ilustración 5: servidores virtuales Estos servidores se ejecutaron en una instancia Hyper-V en PACNEC02. Todos los servidores virtuales se arrancaron desde archivos de VHD almacenados localmente en el servidor PACNEC02 y todos tenían acceso configurado a la LAN virtual del laboratorio. A algunos de estos servidores virtuales se les proporcionó acceso directo de disco dentro del sistema operativo invitado a un LUN en la SAN. El acceso directo al disco que se proporcionó aumentó el rendimiento frente a utilizar un disco VHD, y se utilizó para acceder a los servidores de FAST Search. A continuación presentamos una lista de los diferentes tipos de servidores virtuales que se ejecutaron en el laboratorio, así como los detalles de sus recursos y los servicios proporcionados. Tipo de servidor virtual Plataformas de prueba (TestRig-1 a TestRig-20) TestRig-1 es el controlador de pruebas de de Visual Studio 2010 Ultimate TestRig-2 - TestRig19 son los agentes de pruebas de Visual Studio Agents 2010, controlados por TestRig-1 SP: Administración central, SA de almacenamiento seguro, rastreador APP-1 : host de Administración central de SharePoint y host de aplicación del servicio de FAST Search. APP-2 - : aplicaciones de servicios de SharePoint y host de aplicación del servicio de FAST Search. Este servidor de aplicaciones se ejecutó siguiendo las aplicaciones de servicio Descripción El controlador de pruebas y los agentes de pruebas de Visual Studio 2010 Ultimate para hacer la prueba de carga en la granja. Estos servidores virtuales se configuraron con 4 procesadores virtuales y 8 GB de memoria. Estos servidores utilizaron un VHD como disco. Estas máquinas virtuales hospedan la Administración central de SharePoint y las aplicaciones de servicios utilizadas dentro de la granja. Estos servidores virtuales se configuraron con 4 procesadores virtuales y 16 GB de memoria. Estos servidores utilizaron un VHD como disco. 15

compartido de SharePoint: Aplicación de servicio de almacenamiento seguro. Aplicación del servicio de FAST Search. Administración y servicio de FAST FAST-SSA-1 y FAST-SSA-2 : aplicaciones de servicio de FAST Search 1 y 2 respectivamente. Índice-búsqueda FAST FAST-IS-1, FAST-IS2, FAST-IS3, and FAST-IS4 : índice FAST, búsqueda, nodos del analizador de webs 1, 2, 3 y 4. Servidor web front-end (SharePoint y FAST Search) WFE-1, WFE-2 y WFE-3 : servidor web front-end 1, 2 y 3, parte de la configuración de carga equilibrada que hospeda al primer Centro de documentación. Estos servidores virtuales se configuraron con 4 procesadores virtuales y 8 GB de memoria. WFE-4, WFE-5 y WFE-6 : servidor web front-end 4, 5 y 6, parte de la configuración de carga equilibrada que hospeda al segundo Centro de documentación. Estos servidores virtuales se configuraron con 4 procesadores virtuales y 8 GB de memoria. Estas máquinas virtuales hospedan el servicio y la administración de Fast Search. Cada una se configuró con 4 procesadores virtuales, 16 GB de memoria y utilizaron un VHD como disco. Estas máquinas virtuales hospedan la el índice FAST y los nodos de búsqueda y del analizador de webs utilizados dentro de la granja. Se configuraron con 4 procesadores virtuales, 16 GB de memoria y utilizaron un VHD como disco de arranque. Cada uno tenía acceso directo como disco a 3 TB de LUN de SAN para el almacenamiento del índice FAST. Estos servidores virtuales hospedan a todos los servidores web front-end y a un host de rastreo FAST dedicado dentro de la granja. Cada base de datos de contenido incluía un centro de documentación configurado con 3 WFE de SharePoint Server de carga equilibrada. Esto se llevó a cabo para facilitar la combinación de textos para realizar la prueba de carga en dos bases de datos de contenido. En una granja real, cada WFE se dirigiría a varias bases de datos de contenido. Estos servidores utilizaron un VHD como disco. Almacenamiento en disco El almacenamiento consiste en el almacenamiento unificado de EMC VNX5700. La matriz VNX5700 se conectó a cada servidor físico (PACNEC01 y PACNEC02) con un canal de fibra de 8 GBPS. Cada servidor físico contiene tres adaptadores de host bus de canal de fibra para poder conectarse a ambos procesadores de almacenamiento en la SAN primaria, lo que proporciona una redundancia y permite a la SAN equilibrar los LUN en los procesadores de almacenamiento. Red de área de almacenamiento: matriz EMC VNX5700 Se utilizó una matriz EMC VNX5700 (http://www.emc.com/products/series/vnx-series.htm#/1) para almacenar las bases de datos de SQL Server y el índice de búsqueda de FAST Search Server 2010 for SharePoint. El VNX5700, tal como se configuró, incluía 300 terabytes (TB) de disco sin formato. La matriz se rellenó con 250 unidades SAS de 600 GB de 16

10.000 RPM y 75 unidades SAS near-line de 2TB de 7.200 RPM (las unidades SAS near-line tienen interfaces físicas SATA y conectores SAS mientras que las unidades habituales SAS tienen interfaces físicas SCSI). Las unidades se configuraron en formato RAID-10 para la creación de reflejos y franjas. El volumen de RAID configurado en la red de área de almacenamiento (SAN) se dividió en 3 grupos y los LUN se asignaron de a partir de un grupo específico, tal como se muestra en Tabla 2. Grupo Descripción Tipo de unidad Capacidad de Asignado (GB) nº usuario (GB) 0 FAST SAS 31.967 24.735 1 Base de datos de contenido SAS 34.631 34.081 2 Libre; sin utilizar NL SAS 58.586 5.261 Tabla 2: grupos de SAN asignados Números de unidad lógica (LUN) en el VNX 5700 se definieron como se muestra en Tabla 3. LUN nº Descripción Tamaño (GB) Servidor Grupo de disco nº Letra de unidad 0 BD de servicio de SP 1.024 PACNEC01 0 F 1 Espacio adicional de 5.120 PACNEC02 0 PACNEC02 2 Índice FAST 1 3.072 PACNEC02 0 F 3 Índice FAST 2 3.072 PACNEC02 0 G 4 Índice FAST 3 3.072 PACNEC02 0 H 5 Índice FAST 4 3.072 PACNEC02 0 I 6 DB de contenido 1 7.500 PACNEC01 1 H 7 DB de contenido 2 6.850 PACNEC01 1 I 8 DB de contenido 3 6.850 PACNEC01 1 J 9 DB de contenido 4 6.850 PACNEC01 1 K 10 TransLog de DB de contenido 2.048 PACNEC01 1 G de SP 11 TransLog de BD de servicio de 512 PACNEC01 0 L SP 12 DB temporal 2.048 PACNEC01 1 M 13 Registro de DB temporal 2.048 PACNEC01 0 N 14 BD de mantenimiento de 3.072 PACNEC01 0 O utilización de SP 15 BD de rastreo / BD admin. de 1.024 PACNEC01 1 P FAST 16 Libre; sin utilizar 5.120 PACNEC01 2 17 Contenido bruto de doc. 3.072 PACNEC01 Adicional T Office 18 Archivos de intercambio de 1.024 PACNEC02 Adicional K WM 19 Copia de seg. de BD 1 16.384 PACNEC01 Adicional R 20 Copia de seg. de BD 2 16.384 PACNEC01 Adicional A Tabla 3: números de unidad lógica 17

Red de área de almacenamiento: matriz de disco adicional Se utilizó una matriz de disco de rendimiento más bajo como respaldo y para hospedar el contenido bruto de los documentos de Office que se cargaron a la granja de SharePoint Server 2010. Esta matriz no se utilizó durante la ejecución de pruebas. Arquitectura de la granja de prueba de SharePoint Server y SQL Server La arquitectura lógica se definió para demostrar los límites recomendados de SharePoint Server 2010. La arquitectura consiste en dos aplicaciones web, cada una de las cuales contiene una sola colección de sitios en una sola base de datos de contenido exclusiva. Cada base de datos de contenido se cargó con 60 millones de documentos del tipo Microsoft Word (.docx), Excel (.xlsx), PowerPoint (.pptx) y páginas de lenguaje de marcado de hipertexto (.html), con un promedio de 250 kilobytes (KB) de tamaño. El tamaño de la base de datos de contenido era de aproximadamente 15 TB cada una, es decir, 30 TB en conjunto. La arquitectura lógica del laboratorio a gran escala se muestra en la ilustración 6. Document Center Farm and Data/Storage IIS Web Site SharePoint Services Application Pool Secure Store Service Application IIS Web Site SP CA v4 Application Pool Web Application 1 Central Administration E M C http://app-1:2010 V N X 5 7 0 0 SharePoint Central Administration SharePoint Content SharePoint Configuration FAST Crawl/Admin TempDB Default group Bulk S A N FAST Index VMs Swap Swap Swap Swap Swap IIS Web Site doccenter1.lab80 IIS Web Site doccenter2.lab81 IIS Web Site search.lab2011 Application Pool Application Pool Application Pool Web Application 2 Document Center Template Web Application 3 Document Center Template Web Application 4 FAST Search Center Template http://doccenter1:80 http://doccenter2:81 http://search.lab:2011 arquitectura de software Ilustración 6: La granja del Centro de documentación de SharePoint debe utilizarse en un escenario de archivo de documentos y se diseñó para acomodar un gran número de documentos almacenados en varias bibliotecas de documentos. Las bibliotecas de documentos estaban limitadas a aproximadamente un millón de documentos cada una y la jerarquía de carpetas estaba limitada a aproximadamente 2.000 elementos por contenedor. Esto se realizó únicamente para poder llevar a cabo un gran proceso de carga de documentos y evitar que el tiempo de carga disminuyera después de superar el millón de elementos de la biblioteca. 18

Sitios web de IIS de la granja de SharePoint Ambas colecciones de sitios de contenido aprovecharon la plantilla del Centro de documentación. La colección de sitios del Centro de búsqueda aprovechó la plantilla del Centro de búsqueda FAST. Cada colección de sitios estaba en una aplicación web exclusiva. Cada aplicación web utilizó un grupo de aplicaciones independiente. Sitio web de IIS: SharePoint Services En el sitio web de IIS de SharePoint Services se hospedan los servicios compartidos utilizados en SharePoint Server 2010. Para los objetivos de este laboratorio, se utilizó al almacenamiento seguro. Sitio web de IIS: Administración central de SharePoint v4 En el sitio web de IIS de la Administración central de SharePoint se hospeda el sitio de Administración central y la interfaz de usuario de SharePoint Server 2010. Sitio web de IIS: Centro de documentación 1 En el sitio web de IIS del Centro de documentación 1 se hospeda el primer archivo del Centro de documentación. Sitio web de IIS: Centro de documentación 2 En el sitio web de IIS del Centro de documentación 2 se hospeda el segundo archivo del Centro de documentación. Sitio web de IIS: Centro de búsqueda FAST En el sitio web de IIS del Centro de búsqueda FAST se hospeda la interfaz de usuario de búsqueda de la granja. Al llegar a los 70 millones y superarlos, la base de datos de rastreo se volvió notablemente más lenta y fueron necesarios algunos trabajos de ajuste para llevarla de 100 millones a 120 millones. Bases de datos de SQL Server Las siguientes bases de datos de SQL Server se hospedan en la red de área de almacenamiento (SAN) EMC VNX 5700. Nombre de BD Finalidad Tamaño (MB) SharePointAdminContent_<GUID> Base de datos de la Administración central de SharePoint 768 SharePoint_Config Base de datos de configuración de SharePoint 1.574 Bases de datos de sistema: tempdb Base de datos temporal de SQL Server 16.384 ReportServer ReportServerTempDB Una base de datos de Microsoft SQL Server que almacena todos los metadatos de informes incluidos las definiciones de informes, el historial y las instantáneas de informes y la información de programación. Una base de datos de Microsoft SQL Server que almacena todas las instantáneas temporales mientras se ejecutan los informes. 10 3 SPContent01 (base de datos de contenido del Centro de Bases de datos de contenido de SharePoint 15.601.286 19

documentación 1) SPContent02 (base de datos de contenido del Centro de documentación 2) Bases de datos de contenido de SharePoint 15.975.266 FAST_Query_CrawlStoreDB_<GUID> FAST_Query_CrawlStoreDB_<GUID> FAST_Query_PropertyStoreDB_<GUID> FASTContent_CrawlStoreDB_<GUID> FASTContent_DB_<GUID> FASTSearchAdminDatabase WSS_Content_FAST_Search Almacén de rastreo para la aplicación de servicio de búsqueda de consultas FAST Search. Esta base de datos de almacén de rastreo solo se utiliza para los perfiles de usuario (Búsqueda de personas). Base de datos de administración para la aplicación de servicio de búsqueda de consultas FAST Search. Almacena las propiedades de metadatos y los descriptores de seguridad de los elementos del perfil de usuario en el índice de búsqueda de personas. Está involucrado en las consultas de búsqueda de personas basadas en propiedades y devuelve atributos de documentos estándar para los resultados de consultas de búsqueda de personas. Almacén de rastreo para la aplicación de servicio de búsqueda de contenido FAST Search. Esta base de datos de almacén de rastreo se utiliza para todos los elementos rastreados excepto para los perfiles de usuario. Base de datos de administración para la aplicación de servicio de búsqueda de contenidos FAST Search. Base de datos de administración para la granja de FAST Search Server 2010 for SharePoint. Almacena y gestiona la configuración de grupos de búsqueda, palabras clave, sinónimos, promociones y disminuciones de nivel de documentos y sitios, inclusiones y exclusiones del extractor de propiedades, exclusiones de ortografía, opciones visuales más probables y metadatos de esquema de búsqueda.. Base de datos de contenido del Centro de búsqueda FAST 15 125 173 502.481 23 4 52 20

LoadTest2010 Tabla 4: bases de datos de SQL Server Repositorio de resultados de la prueba de carga 4.099 Índices de contenido de FAST Search Server 2010 for SharePoint Los directorios de datos de FAST Search Server 2010 for SharePoint utilizan una unidad de paso a través de Hyper-V directamente en la SAN. En el servidor virtual FAST-IS1, el directorio de datos utiliza 745 GB de los 3 TB, sin utilizar ningún espacio temporal (todo de limpió con anterioridad). Tabla 5 muestra el almacenamiento de datos de las carpetas de archivos de índice de FAST Search Server 2010 for SharePoint almacenados en la SAN. Nombre Finalidad Número de archivos Tamaño (GB) data_fixml data_index sprel Origen de índice utilizado para crear índice Índice de búsqueda real utilizado por consultas Información de relevancia de SharePoint. Utilizada colocar en la parte superior de la lista los resultados de búsqueda más frecuentes. 6 millones 223 3.729 490 9 3 webanalyzer Subir los documentos vinculados más frecuentemente en el orden de los resultados. Tabla 5: almacenamiento utilizado por 1 de los 4 índices FAST 135 12 El método, la escala de tiempo del proyecto y el proceso de creación de la granja Escala de tiempo del proyecto Esta es la escala de tiempo aproximada del proyecto. Planificación de la arquitectura de granja 2 semanas Instalación del servidor y el hardware de SAN 1 semana Creación de máquinas virtuales para la granja 1 semana Creación de elementos del contenido de muestra 2 semanas Carga de elementos en SharePoint Server 3 semanas Desarrollo de scripts de prueba 1 semana Indización de contenido en FAST Search 2 semanas Prueba de carga 3 semanas Redacción de informe 2 semanas 21

Modo de creación de los documentos de muestra Para poder proporcionar un escenario de archivo de documentos realista, era imprescindible que los documentos fueran exclusivos. Se utilizaron dos utilidades diferentes; la primera para crear documentos exclusivos y la segunda para leer dichos archivos desde el disco y cargarlos directamente en determinadas aplicaciones web de SharePoint y bibliotecas de documentos. Herramienta para crear un gran número de documentos Los documentos se crearon mediante una herramienta de línea de comando denominada Bulk Loader, creada con Microsoft.NET 4.0 Framework. Esta herramienta utiliza un archivo de volcado de contenido de Wikipedia como entrada para permitir la creación de hasta 10 millones de documentos exclusivos en una ubicación del disco. Se utilizan imágenes de archivo para reemplazar las referencias de imágenes de los volcados de Wikipedia. Esta herramienta está como código fuente en http://code.msdn.microsoft.com/bulk-loader-create-unique-eeb2d084. Herramienta para cargar documentos en SharePoint Los documentos se agregaron a SharePoint Server mediante una herramienta de línea de comando denominada LoadBulk2SP, creada con C# y Microsoft.NET 3.5 Framework, para que sea compatible con SharePoint Server. Esta herramienta toma los archivos de salida de disco de la herramienta Bulk Loader como entrada e imita la misma estructura de carpetas y archivos directamente en SharePoint Server mediante determinadas aplicaciones web y bibliotecas de documentos especificadas en la configuración de la aplicación. Con esta herramienta, se cargaron más de 100 millones de documentos de 250 KB en SharePoint Server con un pico de rendimiento de 233 documentos por segundo y un promedio de tiempo de carga de 137 documentos por segundo. Esta herramienta está como código fuente en http://code.msdn.microsoft.com/load-bulk-content-to-3f379974. Características de rendimiento para la carga de documentos a gran escala La carga de documentos se llevó a cabo mediante la herramienta LoadBulk2SP definida anteriormente en este documento. Esta herramienta aprovecha el método SubFolderCollection.Add() para agregar nuevas carpetas a bibliotecas de documentos específicas y el método SPFileCollection.Add() para agregar archivos directamente en las carpetas de la biblioteca de documentos que se han creado. Esta estructura de carpetas y archivos creada en SharePoint Server imita la jerarquía de salida creada por la herramienta Bulk Loader. Tamaños de las bases de datos de contenido de la biblioteca de documentos A continuación se muestran los detalles de los tamaños de las bases de datos de contenido de la biblioteca de documentos, incluidos los grupos de archivos de SQL Server y los archivos principales y secundarios utilizados dentro de la granja. Archivo de contenido de SQL Grupo de archivos LUN Tamaño (KB) Tamaño (MB) Tamaño (GB) Tamaño (TB) SPCPrimary01.mdf Principal H:/ 53.248 52,000 0,050 0,000 SPCData0102.mdf SPCData01 I:/ 3.942.098.048 3.849.697,312 3.759,470 3,671 SPCData0103.mdf SPCData01 J:/ 4.719.712768 4.609.094,500 4.501,068 4,395 SPCData0104.mdf SPCData01 K:/ 3.723.746.048 3.636.470,750 3.551,240 3,468 SPCData0105.mdf SPCData01 H:/ 3.371.171.968 3.292.160,125 3.215,000 3,139 SPCData0106.mdf SPCData01 O:/ 4.194.394 4.096,087 4,000 0,003 Centro de Total: 15.760.968.474 15.391.570,775 15.030,820 14,678 documentación 1 SPCPrimary02.mdf SPCData02 H:/ 52.224 51,00 0,049 0,000 SPCData0202.mdf SPCData02 I:/ 3.240.200.064 3.164.257,875 3.090,095 3,017 SPCData0203.mdf SPCData02 J:/ 3.144.130.944 3.070.440,375 2.998,476 2,928 SPCData0204.mdf SPCData02 K:/ 3.458.544.064 3.377.484,437 3.298,324 3,221 22

SPCData0205.mdf SPCData02 H:/ 3.805.828.608 3.716.629,500 3.629,521 3,544 SPCData0206.mdf SPCData02 O:/ 2.495.168.448 2.436.687,937 2.379,578 2,323 Centro de Total: 16.143.924.352 15.765.551,125 15.396,046 15,035 documentación 2 Total conjunto: 31.904.892.826 31.157.121,900 30.426,876 29,713 Tabla 6: tamaños de bases de datos de SQL Server Jerarquías de bibliotecas de documentos, carpetas y archivos A continuación se muestran detalles de las jerarquías de bibliotecas de documentos, el número total de carpetas y documentos generados para cada Centro de documentación mediante la herramienta LoadBulk2SP. El total de ambos Centros de documentos es de 60.234 carpetas y 120.092.033 archivos. Centro de documentación 1 El número total de carpetas y archivos que contiene cada biblioteca de documentos de la base de datos de contenido de muestra en Tabla 7. Como se indicó anteriormente, los documentos se limitaban a un millón por biblioteca, con el fin de llevar a cabo un gran proceso de carga de contenido. Para obtener los resultados de la arquitectura de granja de SharePoint 2010 y consejos relacionados con el almacenamiento en bibliotecas de documentos a gran escala, consulte un anterior informe sobre pruebas realizadas, Estimación del rendimiento y los requisitos de capacidad para repositorios de documentos a gran escala en SharePoint Server 2010 (en inglés) (http://technet.microsoft.com/ eses/library/hh395916.aspx), que trata sobre el escalado de cantidades de elementos en una biblioteca de documentos. Consulte también las restricciones de SharePoint Server 2010 para los elementos en bibliotecas de documentos y en bases de datos de contenidos, como se explica en Administración de la capacidad de SharePoint Server 2010: restricciones y límites del software (http://technet.microsoft.com/es-es/library/cc262787.aspx) en TechNet. Centro de documentación 1 Recuentos Biblioteca de documentos Carpetas Archivos TOTAL DE CD1: 30.447 60.662.595 Tabla 7: bibliotecas de documentos en el Centros de documentación 1 Centro de documentación 2 El número total de carpetas y archivos que contiene cada biblioteca de documentos de la base de datos de contenido de muestra en Tabla 8. Centro de documentación 2 Recuentos Biblioteca de documentos Carpetas Archivos TOTAL DE CD2: 29.787 59.429.438 TOTAL DE CD1: 30.447 60.662.595 TOTAL CONJUNTO: 60.234 120.092.033 Tabla 8: bibliotecas de documentos en el Centros de documentación 2 A continuación se muestran muestras de las cinco ejecuciones principales de la herramienta LoadBulk2SP, en cuatro procesos simultáneos, cada uno con 16 subprocesos dirigidos a diferentes Centros de documentación, bibliotecas de documentos y carpetas y archivos de entrada. 23

Ejecución 26: Time Segundos Carpetas Archivos Docs/seg 5 carpetas con Horas 0 0 315 639.980 233 2.000 archivos Minutos 45 2.700 Segundos 46 46 58264 Total: 2.746 Ejecución 9: Time Segundos Carpetas Archivos Docs/seg 30 carpetas con Horas 5 18.000 1.920 3.839.864 178 2.000 archivos Minutos 58 3.480 Segundos 46 46 Total: 21.526 Ejecución 10: Time Segundos Carpetas Archivos Docs/seg 30 carpetas con Horas 6 21.600 1.920 3.839.881 162 2.000 archivos Minutos 33 1.980 Segundos 50 50 Total: 23.630 Ejecución 8: Time Segundos Carpetas Archivos Docs/seg 30 carpetas con Horas 6 21.600 1.920 3.839.857 155 2.000 archivos Minutos 51 3.060 Segundos 30 30 Total: 24.690 Ejecución 7: Time Segundos Carpetas Archivos Docs/seg 30 carpetas con Horas 6 21.600 1.920 3.839.868 154 2.000 archivos Minutos 55 3.300 Segundos 0 0 Total: 24.900 Tabla 9: resultados detallados de rendimiento por LoadBulk2SP Operaciones de entrada-salida por segundo (IOPS) SQLIO es una herramienta para realizar pruebas de esfuerzo que determina la capacidad de E/S de una configuración concreta. Se ejecutó en el sistema después de que se completaran de las pruebas de rendimiento. Por lo tanto, varios discos respaldados por LUN de SAN no pudieron incluirse, debido a que ya tenían demasiados datos existentes. La prueba SQLIO se ejecuta en cada letra de unidad individualmente y realiza una prueba en todas las unidades a la vez. Puede ver las IOPS/GB en la columna de la derecha, esto se calcula al dividir las IOPS por la capacidad de la unidad. En estas unidades que se probaron a la vez, conseguimos 105.730 IOPS. 24

Las IOPS como se probaron con la herramienta SQLIO LUN Descripción de LUN Tamaño (GB) IOPS de escritura (máx.) IOPS de lectura (máx.) IOPS en total (máx.) IOPS por GB F: BD de servicio de SP 1024 2.736 23.778 26.514 25,89 G: Tranlog de BD de contenido 2048 3.361 30.021 33.383 16,30 L: Tranlog de BD de servicio 512 2.495 28.863 31.358 61,25 M: TempDB 2048 2.455 21.778 24.233 11,83 N: O: P: Registro TempDB DB de contenido 5 BD rastreo/admin. 2048 2.751 29.522 32.273 15,76 3.072 2.745 28.767 31.511 10,26 1024 2.603 22.808 25.411 24,81 Todo junto 11776 16.665 89.065 105.730 8,98 TOTAL: 11.776 19.145 185.536 310.412 PROMEDIO: 1.682 2.735 26.505 38.801 22 Tabla 10: resultados de pruebas realizadas en la SAN por la herramienta SQLIO IOPS logradas durante la prueba de carga Se ejecutaron trabajos de Performance Monitor constantemente, a la vez que indizaciones de FAST, cargas de contenidos y ejecuciones de pruebas de carga de Visual Studio. La siguiente tabla refleja las IOPS máximas logradas por LUN e identifica cada LUN, Descripción, Tamaño total, Máximo de lecturas, Máximo de escrituras, IOPS en total y IOPS por GB. Debido a que estos resultados se obtuvieron durante una prueba, reflejan las IOPS que el entorno de prueba pudo conducir a la SAN. Debido a que se pudieron incluir las unidades H:, I:, J: y K:, las IOPS logradas en total es mucho mayor que en la prueba realizada con SQLIO. LUN Descripción de LUN Tamaño (GB) IOPS de escritura (máx.) IOPS de lectura (máx.) IOPS en total (máx.) IOPS por GB G: Tranlog de BD de 2048 5.437 11.923 17.360 8,48 contenido H: DB de contenido 1 6.850 5.203 18.546 23.749 3,47 25

I: DB de contenido 2 6.850 5.284 11.791 17.075 2,49 J: DB de contenido 3 7.500 5.636 11.544 17.180 2,29 K: DB de contenido 4 6.850 5.407 11.146 16.553 2,42 L: Tranlog de BD de 512 5.285 10.801 16.086 servicio 31,42 M: TempDB 2048 5.282 11.089 16.371 7,99 N: Registro TempDB 2048 5.640 11.790 17.429 8,51 O: DB de contenido 5 3072 5.400 11.818 17.218 5,60 P: BD rastreo/admin. 1024 5.249 11.217 16.467 16,08 TOTAL: 31.365 53.824 121.667 175.491 PROMEDIO: 3.136 5.382 12.167 17.549 5,60 Tabla 11: IOPS medidos por los registros de Perfmon Rastreo de documentos de FAST Search Server 2010 for SharePoint El rastreo de sitios de SharePoint se realiza mediante el rastreador de SharePoint configurado para alimentar a los distribuidores de contenido de FAST. La Aplicación del servicio de búsqueda (SSA) de contenidos se configuró para ejecutarse en dos servidores, APP-1 y APP-2, y la SSA de consulta se ejecutó en los servidores FAST-1 y FAST-2. Se ejecutaron 100 procesadores de documentos de indización de FAST en la máquina de SQL Server. Tomamos esta captura de pantalla del administrador de tareas en el equipo que mostraba la actividad mientras se ejecutaba el trabajo del procesador de documentos y una prueba de carga con 10.000 usuarios en SQL Server, que también se ejecutaba en el mismo equipo. Ilustración 7: administrador de tareas de PACNEC01 durante la indización de FAST y la prueba de carga 26

Resultados de las pruebas Para poder generar una carga significativa durante la prueba, se utilizó el siguiente software: Visual Studio 2010 Ultimate, Visual Studio 2010 Load Control y Microsoft Visual Studio Agents 2010 1. Es necesaria una plataforma de pruebas para poder simular el número de usuarios, así como producir una carga significativa. Las plataformas de pruebas están compuestas de una máquina con un controlador de pruebas y una o varias máquinas de agentes de pruebas. El controlador de pruebas administra y coordina las máquinas de agentes, y los agentes se utilizan para generar una carga en SharePoint Server. El controlador de pruebas también es responsable de recopilar datos del control de rendimiento por parte de las máquinas que participan en la prueba y de las máquinas de agentes. Esta sección identifica los resultados de las ejecuciones de pruebas de rendimiento. Serie de pruebas A: variación de usuarios En esta serie de pruebas, variamos el número de usuarios cargados en la granja de prueba. Ilustración 8 muestra las solicitudes por segundo que el controlador de pruebas de Visual Studio 2010 Ultimate pudo procesar mediante la granja de SharePoint durante las pruebas realizadas en cada uno de los tamaños de carga de usuarios. Puede observarse que a medida en que se aplicaban cargas de usuarios adicionales, las solicitudes aumentaban debido a la gran cantidad de usuarios, pero cuando se alcanzan los 15.000, debido a que la granja está muy cargada, no aumentan tanto como la carga aplicada. Debido a que la prueba de 15.000 usuarios necesitó más tiempo para realizar el aumento, ejecutamos esta prueba durante 2 horas en lugar de la línea base de 1 hora. Debido a la carga, también nos dimos cuenta de que 3 servidores web front-end no eran suficientes. Ejecutamos esta prueba con 6 servidores web front-end. 250 200 150 100 Promedio de RPS 50 0 A.1 4.000 A.2 10.000 A.3 15.000 Ilustración 8: promedio de RPS en la serie A En la ilustración Ilustración 9 puede observar que el tiempo de respuesta de las transacciones de prueba aumenta en la misma medida que el tiempo de actualización de páginas, en el test a gran escala de 15.000 usuarios. Esto demuestra 1 Visual Studio Agents 2010 (en inglés) 27