Investigación operativa aplicada al Help Desk INTRODUCCION Este artículo está dirigido a aquellas personas que tienen la responsabilidad del diseño de estructuras de soporte, ya sea de empresas de Outsourcing o Gerentes de Sistemas y Managers de Help Desk de servicios internos. La mayoría de fórmulas y calculadoras de staffing están basadas en relacionar la demanda esperada con la capacidad operativa de cada puesto. A estas formulas Se le agregan factores que hacen más realista las estimaciones considerando por ejemplo los tiempos de descanso y las posibles indisponibilidad de los recursos, pero siempre intentan nivelar la siguiente ecuación: Demanda Total = Cantidad de puestos * Capacidad Operativa de cada puesto Este tipo de formulas son correctas y nos permiten un primer acercamiento al dimensionamiento definitivo. Pero son incompletas pues no responden a una serie de interrogantes que tenemos en el momento del diseño como por ejemplo: Cuántos Analistas de Help Desk necesito para reducir la tasa de abandono del 11% al 5%? Cuántas personas estarán esperando ser atendidas mientras escuchan el mensaje de bienvenida? Cuál será el tiempo medio de resolución en el 2 nivel? Cuántos incidentes pendientes tendrá el laboratorio de hardware como promedio? Cuál será el tiempo de respuesta de un técnico on site? En cuánto disminuye ese tiempo si agrego un técnico más al equipo? Existe tiempo ocioso en algún punto de la cadena de servicio? Dónde se producen los cuellos de botella? La pregunta del millón: Cuál es el punto óptimo de nivel de servicio en función del costo/beneficio? Y muchos interrogantes más. Seguramente muchos dirán que esa información se toma de mediciones reales ya con un servicio en marcha y se ajustan en consecuencia. Esto también es cierto, pero si encontramos un método que nos permita anticipar toda esa información podremos diseñar una estructura mucho más precisa y ahorrarnos las modificaciones sobre la marcha que nunca son gratuitas. El método del que hablamos y que nos permitirá diseñar, probar y ajustar el staffing y su performance es la rama de Investigación Operativa llamada Teoría de Colas. TEORIA DE COLAS El origen de la Teoría de Colas se debe a Agner Erlang nacido en Dinamarca en 1878. El realizó investigaciones en la ciudad de Copenhague con el objeto de optimizar su sistema telefónico. Estas acabaron en una nueva teoría llamada teoría de colas o de líneas de espera. Esta teoría se ha convertido en una herramienta de utilidad en los negocios debido a que muchos problemas pueden encuadrarse como problemas de congestión o de
espera/atención. El problema es determinar qué capacidad o tasa de servicio proporciona el balance correcto. Esto no es sencillo, ya que un cliente no llega a un horario fijo, es decir, no se sabe con exactitud en qué momento llegarán los clientes. También el tiempo de servicio no tiene un horario fijo. Los problemas de Colas se presentan permanentemente la vida diaria: Cajas en un supermercado Registradoras en una Terminal de Transporte Puestos de check-in en un aeropuerto Camas en un hospital Definición Teoría de Colas es el estudio matemático del comportamiento de líneas de espera. Estas se presentan cuando "clientes" llegan a un "lugar" demandando un servicio a un "servidor" el cual tiene cierta capacidad de atención. Si el servidor no está disponible inmediatamente y el cliente decide esperar, entonces se forma en la línea de espera. En un modelo de colas se identifican como mínimo a los siguientes elementos: Clientes: Entidad que espera o demanda ser atendido (ej.: clientes que finalizan su compra en un supermercado) Puestos de servicio: Son las unidades de servicio disponibles en el sistema (ej. Cajas habilitadas en el supermercado) Tasa de arribo: Es el número de clientes que llegan a los puestos de servicio por unidad de tiempo (Ej. Cantidad de clientes que se acercan a las cajas de un supermercado por hora) Tasa de servicio: O tiempo de atención, es el tiempo promedio en que un cliente permanece en el puesto de servicio.
Mediante el uso de métodos analíticos o de simulación, cuyo desarrollo por su longitud escapan del alcance de este artículo, es posible calcular una infinidad de incógnitas del tipo: Probabilidad de que haya más de X usuarios simultáneamente en el sistema. Probabilidad de que alguno de los puestos esté ocioso. Probabilidad de que un cliente permanezca más de X minutos en la cola. Probabilidad de que haya cola. Longitud media de la cola. Tiempo medio de espera en cola. Probabilidad de que el cliente esté menos de X minutos en el sistema. Fracción de clientes que deben esperar. Etc. Una visión sobre la optimización de costos En el dimensionamiento de un sistema normalmente se encuentra la disyuntiva de maximizar el nivel de servicio para disminuir los tiempos de espera o si sacrifico estos últimos en pos de una reducción en el costo del servicio. Para responder a esto debemos conocer de la manera más precisa posible estos dos costos: El costo asociado al aumento de la capacidad de servicio El costo asociado a la espera de los clientes En el grafico anterior se representa la función de costo por incremento de capacidad de servicio, la función de costo por disminución del tiempo de espera y una función adicional (barras) que muestra la suma de ambos costos. El desafío es encontrar el punto mínimo de dicha función suma. En ese punto se encontrarán equilibradas las justificaciones de servicio vs. El costo de satisfacer la demanda.
Aplicación práctica en un Help Desk Ya llegado a este punto habrán encontrado mucha similitud a lo que ocurre habitualmente en un Help Desk. Tratemos de convertir la dinámica de un centro de atención normal con un 1er nivel de atención y varios 2dos niveles. En la teoría de colas se estudian varias alternativas de sistemas o modelos, aquí sólo aplicaremos el Modelo de Cola con las siguientes premisas: Cola con desaliento (si el usuario debe esperar mucho tiempo desiste de ser atendido: Abandono) Sistema con tasa de servicio dependiente del estado del sistema (Cuanto más llamados ingresan al Help Desk menor es la duración de la atención) Sistema con servidor adicional cuando la cola es grande (plan de contingencia o previsión de curvas de demanda), se consideran también clientes internos donde no existe otra alternativa de servicio. Orden de atención: FIFO (First In First Out) excepto aplicación de criterios de prioridad. Aunque a simple vista resulte complejo, el diagrama anterior no es otra cosa que representar el circuito de los llamados/incidentes de un Service Desk como un sistema de múltiples colas.
En primer lugar los llamados no atendidos inmediatamente son derivados a un sistema de mensajes lo que constituye la primer cola del sistema. Allí, aquellos usuarios que deciden no esperar son los llamados abandonados. En el sistema hay que considerar los distintos momentos del día para estimar la tasa de arribos de los llamados. Los recursos asignados a cada grupo de resolución serán variables en función del aumento de la demanda. Los incidentes no resueltos en el primer nivel se derivan al segundo conformando nuevamente n sistemas de colas dependiendo de la cantidad de grupos existan. Cada cola ahora puede ser tratada individualmente. El tiempo de respuesta de cada nivel será igual al tiempo de permanencia del incidente en cola. Como dijimos, la obtención de información puede ser analítica, mediante el empleo de fórmulas disponibles en cualquier manual de Investigación Operativa o mediante la simulación construyendo un modelo. Este puede ser realizado con un lenguaje de programación o bien con planillas Excel. En todo caso debe quedar en claro que la tarea de dimensionamiento de equipos cuando se le agregan variables de niveles de servicio es una tarea que demanda por un lado información estadística de campo y mucho trabajo de laboratorio. Por otro lado la construcción de un modelo, aparte de darnos una idea bien acabada de cómo será el comportamiento real, relaciona las distintas variables del sistema entre sí, y si en algún momento es necesario realizar un ajuste en una, sabremos como impacta ese ajuste en las demás.